Tez Türü: Doktora
Tezin Yürütüldüğü Kurum: İstanbul Teknik Üniversitesi, Lisansüstü Eğitim Enstitüsü, Geomatik Mühendisliği, Türkiye
Tez Danışmanı: Dursun Zafer Şeker
Tezin Onay Tarihi: 2023
Tezin Dili: İngilizce
Desteklendiği Program: Diğer
Özet:
Yollar şehir planlamasından trafik yönetimine, afet yönetiminden askeri müdahalelere kadar birçok araştırma ve uygulama alanına konu olan ve önemini her zaman korumaya devam eden bir coğrafi objelerdir. Bu uygulama ve araştırmaların başarısı, yol bilgilerinin elde edilmesindeki hıza ve doğruluğa bağlıdır. Yoğunlukla veri kaynağı olarak uydu ve/veya hava fotoğraflarından yararlanılan bu çalışmalarda, araştırmacılar yol bilgilerinin otomatik elde edilmesine odaklanmışlardır. Her ne kadar günümüzde yaygın olarak kullanılan yapay zeka temelli yaklaşımlarla başarılı sonuçlar elde edilmiş olsa da, uzaktan algılama verilerinden otomatik olarak yolların bölütlenmesi, karmaşık ve düzensiz yapılarından dolayı hala zorlu ve önemli bir problem olarak ele alınmaktadır.
Yapay zeka, akıl yürütme, algılama ve problem çözme gibi
insani yetilerin bilgisayarlar tarafından gerçekleştirilmesi amacıyla
geliştirilmiştir. Buradaki en temel beklenti, yapay zekanın insanlardaki
düşence olgusunu taklit ederek geleneksel yaklaşımların yetersiz kaldığı
problemlerin üstesinden gelebilmesidir. Yapay zeka ilk olarak makine öğrenmesi
yaklaşımlarıyla gelişim göstermiştir. Makine öğrenmesinde verinin temsili
önceden oluşturulmuş doğrusal ilişkilere dayanmaktadır. Ancak, bu kuralcı
çalışma prensibi, yapay zekadan beklenen seviyede insan beynine benzer karar
verebilme kapasitesini tam olarak karşılamamıştır. Bu kapsamda, yapay zekanın
engel tanımayan gelişimiyle birlikte, makine öğrenmesinden derin öğrenmeye
geçiş gerçekleşmiştir. Derin öğrenme, makine öğrenmesinin aksine, veri ile daha
karmaşık bir ilişki kurarak verinin gizli kalmış özellikleri daha doğru ayırt
edebilmektedir. Derin öğrenme aslında her bir katmanında birden çok temsil
düzeyinde özellik öğrenimi gerçekleştirilen çok katmanlı derinleştirilmiş yapay
sinir ağlarıdır. Derinlik mimarinin oluşturulduğu yapay sinir ağındaki katman
sayısını ifade etmektedir. Verinin temsili anlamlı özelliklerin öğrenilmesi ve
bu özelliklerdeki benzer dokuların benzer veri setlerinde aranarak soyutlanması
şeklindedir.
Derin öğrenme veri odaklı olup, eğitim verilerinin kalitesi,
sayısı ve çeşitliliği modellerin performansını doğrudan etkilemektedir. Bu amaç
doğrultusunda, MNIST, COCO ve ImageNet gibi kapsamlı veri setleri
oluşturulmuştur. Ancak, coğrafi detayları içeren veri setleri, bu veri
setlerine kıyasla kısıtlı kalmıştır. Bu kısıtlı veri modellerin oluşturduğu
karmaşık ilişkilerinin çözümlerinde detayların doğru biçimde genellemesi
gerçekleştirilememektedir. Ayrıca, coğrafi detayları içeren veri setleri
oluşturuldukları bölgelerin karakteristik özelliklerini temsil etmektedir. Bu
veri setleri ile gerçekleştirilen eğitimler sonucunda üretilen modellerin,
sadece bu verilerden öğrenebildiği seviyede detayları ayırt edebilecek
kapasiteye sahip olması kaçınılmazdır. Örneğin, derin öğrenme modellerinin yol
bölütleme problemlerinde kullanılabilirliğinin test edilmesi amaçlı yaygın
olarak DeepGlobe ve Massachusetts yol veri setleri kullanılmaktadır. Ancak, bu
veri setlerin kullanılarak eğitilmiş modellerin, İstanbul gibi karmaşık kent
dokusuna sahip bölgelerdeki yolları başarılı bir şekilde tahmin etmesi oldukça
zordur.
Bu tez kapsamında, derin öğrenme algoritmalarıyla yol
bölütleme çalışmalarındaki veri açığının giderilmesi, çalışma bölgesini temsil
eden veri setlerinin üretilmesi ve yalnızca optik görüntülerin kullanımında
mevcut araştırmaların karşılaştığı problemlerin üstesinden gelinebilmesi için
farklı kaynaklardan elde edilen verilerin birlikte kullanılması hedeflenmiştir.
Bu tez çalışması beş ana bölümünden oluşmaktadır. Giriş bölümünde genel olarak
konu ile ilgili mevcut çalışmalar ve tez çalışmasıyla ilgili kapsamlı bilgiler
verilmiştir.
İkinci bölümünde, veri kaynaklı sorunların üstesinden
gelinebilmesi amacıyla web harita servisi kullanılarak hızlı, doğru ve kapsamlı
yol veri seti üretim alt yapısı oluşturulmuştur. Bu amaçla, kullanıcı
isteklerine bağlı haritaların düzenlenebildiği servis sağlayıcılarından
yararlanılması uygun bulunmuştur. Google Maps Platformunun Static API özelliği
kullanılarak, Python programlama dilinde bir veri üretme programı
geliştirilmiştir. Bu programda uydu
görüntülerine karşılık gelen maske görüntülerinin özellikleri bir JavaScript
koduyla tanımlanmıştır. Yol bölütleme çalışmaları için otomatik bir sabit
harita stili oluşturulmuştur. Ayrıca, geliştirilen bu program kullanılarak
sabit görüntü boyutlarında ve belirlenen test bölgeleri sınırlarında istenilen
sayıda görüntüler rastegele veya dizi halinde üretilebilmektedir. Ayrıca,
Google Maps Platform, görüntüler hakkında coğrafi bilgiler
sağlamamaktadır. Bu açığı kapatabilmek
amacıyla, görüntülerin bilinen merkez
pikselinin enlem ve boylamı ile bu görüntülerin jeo-referanslandırma işlemini
gerçekleştirebilecek özellikte programa eklenmiştir.
Tezin üçüncü bölümünde, yol bülütleme çalışmalarında test edilen bölgenin karakterini ifade eden veri setinin üretilmesi gerekliliğinin ortaya konulması amacıyla, İstanbul yol veri seti oluşturulması hedeflenmiştir. İstanbul’un yol ağı, sürekli artan nüfus miktarıyla birlikte gelişim halindedir. Bununla birlikte, farklı yol tiplerini ve arazi kullanım detaylarını barındırması nedeniyle derin öğrenmenin ihtiyaç duyduğu veri çeşitliliğini karşılayabilecek düzeydedir. İstanbul’un değişen ve gelişen yapısı, onu sürekli gözlemlenmesi ve incelenmesi gereken önemli bölgelerden biri yapmaktadır. Büyük ölçekli yol bölütleme çalışmalarında genellikle yakınlaştırma düzeyi olarak 16 veya 17 tercih edilmektedir. Ancak, farklı yakınlaştırma seviyelerinin yol bölütleme çalışmalarına getireceği katkıların irdelenmesi açısından 14, 15, 16 ve 17 yakınlaştırma seviyeleri çalışmalara dahil edilmiştir. Bu yaklaşımla, İstanbul’da belirlenen test bölgelerinde, her bir yakınlaştırma seviyesi için 10000 adet optik görüntüsü ve bu görüntülerin yol maske görüntüleri üretilmiştir. Üretilen veri setinin derin öğrenme modellerinde performansını test etmek için, görüntü bölütleme çalışmalarında başarılı sonuçlar elde etmiş olan derin artık U-Net mimarisi kullanılmıştır. Eğitimler sonucunda elde edilen modellerin tahmin metrikleri incelendiğinde, İstanbul veri setinin ayrı ayrı her bir yakınlaştırma seviyesinde yol bölütlemesi açısından başarılı sonuçlar elde ettiği tespit edilmiştir. Ayrıca, çalışma bölgesinin dışında üretilen veri setleriyle gerçekleştirilen eğitimlerle üretilen modellerin İstanbul görüntüleriyle tahmin performansını test edebilmek için, yol bölütleme çalışmalarında yaygın olarak tercih edilen DeepGlobe ve Massachusetts veri setleri analizlere dahil edilmiştir. Bu verilerle eğitilen modellerde İstanbul veri seti test edilmiş ve oldukça düşük tahmin doğrulukları elde edilmiştir. Bu durum, çalışma alanındaki yol ağının yerel özelliklerini yansıtan bir veri seti üretilmesi gerekliliğini ortaya koymuştur.
İstanbul veri seti kapsamlı bir şekilde incelendiğinde, 17
yakınlaştırma düzeyinde üretilen görüntülerin diğer yakınlaştırma düzeylerine
göre daha karmaşık piksel ve arka plan yapısına sahip olduğu ve tahmin
doğruluğunun olumsuz etkilendiği tespit edilmiştir. Bu kapsamda, iki alternatif
model önerilmiştir. İlk yaklaşımda başlangıç ağırlıkları olmaksızın 14
yakınlaştırma seviyesinde eğitim gerçekleştirilmiştir ve bu eğitimden elde
edilen ağırlıklar 15 yakınlaştırma seviyesindeki eğitime başlangıç ağırlıkları
olarak dahil edilmiştir. Bu yaklaşımla bir önceki yakınlaştırma seviyesinden
bir sonraki seviyeye ağırlıkları aktararak 17 yakınlaştırma seviyesine kadar
ağrılıkların taşınması gerçekleştirilmiştir. İkinci yaklaşımda ise 17
yakınlaştırma seviyesindeki görüntülere L0 normalizasyon işlemi
gerçekleştirilmiştir. Elde edilen sonuçlara göre, ağırlık taşıma yaklaşımında %2’lere
ve L0 yaklaşımıyla tahmin doğruluklarında %3’lere varan artışlar
elde edilmiştir. Son olarak, tüm
yakınlaştırma seviyelerinde eşit sayıda görüntü içeren yeni bir veri seti
oluşturulmuştur. Eğitim sonucunda oluşturulan modelde her bir yakınlaştırma
düzeyine ait görüntüler ayrı ayrı test edilmiştir. Yakınlaştırma düzeyi ne
olursa olsun modelin amaca uygun olarak otomatik yol bölütleme çalışmalarında
kullanılabilecek başarılı bir model olduğu sonucuna varılmıştır.
Yol bölütlemesi çalışmaları, sadece optik görüntülerin kullanılması, kentsel alanlardaki binaların ve objelerin oluşturduğu gölgeler ve bu nesnelerin yol üzerinde meydana getirdiği engellemeler nedeniyle olumsuz etkilenmektedir. Bu sorunlar, özellikle yüksek çözünürlüklü uydu görüntüleri kullanıldığında daha çok meydana gelmektedir. Ayrıca, özellikle kırsal alanlarda, ağaçların yolları kaplaması bir diğer hata kaynağıdır. Problemlerin çözümünde derin öğrenme modellerinin geliştirilmesinin yanı sıra, sadece uydu görüntülerinin kullanılması yerine uydu görüntülerinin eksikliklerini giderilmesi gerekmektedir. Bu amaçla, farklı türde veriler çalışmalara dahil edilerek modellerin ihtiyaç duyduğu veri gereksiniminin karşılanması sağlanabilir. Bu verilere örnek olarak ele alınabilecek LiDAR verisi, objeler hakkında detaylı bilgiler sunmaktadır. Ayrıca, optik görüntülerde meydana gelen sorunları barındırmadığı için uydu görüntüleriyle birlikte kullanılmasının gerçekleştirilebilmesi halinde yol bölütleme çalışmalarında daha başarılı modeller üretilebilir.
Bu tezin dördüncü bölümünde, tespit edilen problemlerin
çözülebilmesi amacıyla optik görüntüler ile LiDAR nokta bulutunun birlikte
kullanılabilirliği irdelenmiştir. Bu birleşimin gerçekleştirilmesinde özellik
düzeyinde birleşim stratejisinin kullanılması önerilmiştir. Bu stratejide,
optik görüntülerin özellikleri derin öğrenme tabanlı modellerden hesaplanırken,
LiDAR nokta bulutunun özellikleri 3B geometrik ilişki oluşturularak
hesaplanmıştır. Optik görüntüler ve bu görüntülerin yol maskeleri içeren
verinin temininde, bu tezin üçüncü bölümünde geliştirilen veri üretim altyapısı
kullanılmıştır. Önerilen birleşim stratejisinde, optik görüntülerin özellikleri
doğrudan derin öğrenme modelinden hesaplanmıştır. Ancak, 3B nokta bulutu
düzensiz bir yapıdadır ve bu yapıdan anlamlı bilgiler çıkartılması için bir
dizi ön işleme adımına tabi tutulması gerekmektedir. Noktaların komşularıyla
özellik vektörleri oluşturarak bağlamsal bilgi elde edilmektedir. Bu kapsamda,
her bir noktanın 3 boyutlu komşuluk ilişkilerinin belirlenmesi ve bu
komşuluklara bağlı geometrik özelliklerin hesaplanması gerekmektedir. Her bir
nokta için k-en yakın komşuluk (KNN) algoritması kullanılarak komşulukları belirlenmiştir.
Bu komşuluklara bağlı olarak 8 adet özdeğer vektörüne ve 5 adet 3B geometrik
özelliklere bağlı olmak üzere toplamda 13 adet LiDAR özelliği hesaplanmıştır.
Bu hesaplanan özelliklerin, optik görüntü özellikleri ile birleştirilebilmesi
için LiDAR özelliklerinin 2B özellik görüntülerine dönüşümü
gerçekleştirilmiştir. Optik görüntülerin girdi olarak verildiği derin artık
U-Net modelinde son konvolüsyon katmanının öncesinde, yüksek seviye optik
görüntü özelikleri ile hesaplanan LiDAR özellikleri, özellik düzeyinde
birleştirilmiştir.
Ayrıca, U-Net modelinin kodlayıcı bloklarına daha derin özellik çıkarımı gerçekleştirebilen ResNet sinir ağı eklenmiştir. Her biri farklı analiz olacak şekilde entegre edilen ResNet (18, 34, 50 ve 152) mimarileriyle özellik düzeyinde birleşimin performans tutarlılığı irdelenmiştir. Elde edilen sonuçlara göre görüntü ve LiDAR birleşimi, yol bölütleme konusunda tüm analizlerde %1'den %5'e kadar metrik istatistiklerini artırarak daha iyi performans gösterdiği tespit edilmiştir. Bununla birlikte, tek tek oluşturulan tahmin görselleri incelendiğinde, birleşim yönteminin ağaçların olduğu alanlarda yol geometrisinin tamamlanmasına yardımcı olduğu tespit edilmiştir. Bu yöntemle, ağaçlık ve gölge etkilerinin oluştuğu alanlarda derin öğrenme modelinde yalnızca uydu görüntülerinin kullanılmasına nazaran daha iyi bir doğruluk ve kalitede yol piksellerinin bölütlenmesini gerçekleştirildiğini göstermiştir.
Sonuç olarak, çalışma alanına özel optik görüntüler ve bu
görüntülere karşılık gelen yol maske görüntüleri üretebilen program
geliştirilmesi ile derin öğrenme tabanlı yol bölütlemesi çalışmalarında ihtiyaç
duyulan yüksek miktarda verilerin üretiminin daha hızlı gerçekleştirilmesi
sağlanmıştır. Ayrıca, jeo-referanslı veri üretim altyapısının geliştirilmesi,
üretilen veri setlerinde elde edilen optik görüntülerin, özellikle farklı
kaynaklardan elde edilen verilerle kullanılabilirliğini mümkün kılmıştır.
Üretilen veri setleri ile eğitilen derin öğrenme modellerinin performansları,
hem yol bölütleme çalışmaları için başarılı sonuçlar elde edilmesini sağlamış
hem de çalışma alanını karakteristiğini temsil eden verilerin gereksinimini
karşılamıştır. Bununla birlikte, optik görüntülerdeki yol piksellerinin ağaç
veya gölge gibi sebeplerden engellenmesinden kaynaklı derin öğrenme
modellerinin tahminlerindeki problemler,
önerilen farklı kaynaklı verilerin özellik düzeyinde birleşim stratejisi
ile başarılı bir şekilde giderilmiştir.