Çok Kaynaklı ve Çok Ölçekli Veriyle Derin Öğrenme Tabanlı Yol Bölütlenmesi

Tez Türü: Doktora

Tezin Yürütüldüğü Kurum: İstanbul Teknik Üniversitesi, Lisansüstü Eğitim Enstitüsü, Geomatik Mühendisliği, Türkiye

Tez Danışmanı: Dursun Zafer Şeker

Tezin Onay Tarihi: 2023

Tezin Dili: İngilizce

Desteklendiği Program: Diğer

Özet:

Yollar şehir planlamasından trafik yönetimine, afet yönetiminden askeri müdahalelere kadar birçok araştırma ve uygulama alanına konu olan ve önemini her zaman korumaya devam eden bir coğrafi objelerdir. Bu uygulama ve araştırmaların başarısı, yol bilgilerinin elde edilmesindeki hıza ve doğruluğa bağlıdır. Yoğunlukla veri kaynağı olarak uydu ve/veya hava fotoğraflarından yararlanılan bu çalışmalarda, araştırmacılar yol bilgilerinin otomatik elde edilmesine odaklanmışlardır. Her ne kadar günümüzde yaygın olarak kullanılan yapay zeka temelli yaklaşımlarla başarılı sonuçlar elde edilmiş olsa da, uzaktan algılama verilerinden otomatik olarak yolların bölütlenmesi, karmaşık ve düzensiz yapılarından dolayı hala zorlu ve önemli bir problem olarak ele alınmaktadır.

Yapay zeka, akıl yürütme, algılama ve problem çözme gibi insani yetilerin bilgisayarlar tarafından gerçekleştirilmesi amacıyla geliştirilmiştir. Buradaki en temel beklenti, yapay zekanın insanlardaki düşence olgusunu taklit ederek geleneksel yaklaşımların yetersiz kaldığı problemlerin üstesinden gelebilmesidir. Yapay zeka ilk olarak makine öğrenmesi yaklaşımlarıyla gelişim göstermiştir. Makine öğrenmesinde verinin temsili önceden oluşturulmuş doğrusal ilişkilere dayanmaktadır. Ancak, bu kuralcı çalışma prensibi, yapay zekadan beklenen seviyede insan beynine benzer karar verebilme kapasitesini tam olarak karşılamamıştır. Bu kapsamda, yapay zekanın engel tanımayan gelişimiyle birlikte, makine öğrenmesinden derin öğrenmeye geçiş gerçekleşmiştir. Derin öğrenme, makine öğrenmesinin aksine, veri ile daha karmaşık bir ilişki kurarak verinin gizli kalmış özellikleri daha doğru ayırt edebilmektedir. Derin öğrenme aslında her bir katmanında birden çok temsil düzeyinde özellik öğrenimi gerçekleştirilen çok katmanlı derinleştirilmiş yapay sinir ağlarıdır. Derinlik mimarinin oluşturulduğu yapay sinir ağındaki katman sayısını ifade etmektedir. Verinin temsili anlamlı özelliklerin öğrenilmesi ve bu özelliklerdeki benzer dokuların benzer veri setlerinde aranarak soyutlanması şeklindedir.

Derin öğrenme veri odaklı olup, eğitim verilerinin kalitesi, sayısı ve çeşitliliği modellerin performansını doğrudan etkilemektedir. Bu amaç doğrultusunda, MNIST, COCO ve ImageNet gibi kapsamlı veri setleri oluşturulmuştur. Ancak, coğrafi detayları içeren veri setleri, bu veri setlerine kıyasla kısıtlı kalmıştır. Bu kısıtlı veri modellerin oluşturduğu karmaşık ilişkilerinin çözümlerinde detayların doğru biçimde genellemesi gerçekleştirilememektedir. Ayrıca, coğrafi detayları içeren veri setleri oluşturuldukları bölgelerin karakteristik özelliklerini temsil etmektedir. Bu veri setleri ile gerçekleştirilen eğitimler sonucunda üretilen modellerin, sadece bu verilerden öğrenebildiği seviyede detayları ayırt edebilecek kapasiteye sahip olması kaçınılmazdır. Örneğin, derin öğrenme modellerinin yol bölütleme problemlerinde kullanılabilirliğinin test edilmesi amaçlı yaygın olarak DeepGlobe ve Massachusetts yol veri setleri kullanılmaktadır. Ancak, bu veri setlerin kullanılarak eğitilmiş modellerin, İstanbul gibi karmaşık kent dokusuna sahip bölgelerdeki yolları başarılı bir şekilde tahmin etmesi oldukça zordur.

Bu tez kapsamında, derin öğrenme algoritmalarıyla yol bölütleme çalışmalarındaki veri açığının giderilmesi, çalışma bölgesini temsil eden veri setlerinin üretilmesi ve yalnızca optik görüntülerin kullanımında mevcut araştırmaların karşılaştığı problemlerin üstesinden gelinebilmesi için farklı kaynaklardan elde edilen verilerin birlikte kullanılması hedeflenmiştir. Bu tez çalışması beş ana bölümünden oluşmaktadır. Giriş bölümünde genel olarak konu ile ilgili mevcut çalışmalar ve tez çalışmasıyla ilgili kapsamlı bilgiler verilmiştir.

İkinci bölümünde, veri kaynaklı sorunların üstesinden gelinebilmesi amacıyla web harita servisi kullanılarak hızlı, doğru ve kapsamlı yol veri seti üretim alt yapısı oluşturulmuştur. Bu amaçla, kullanıcı isteklerine bağlı haritaların düzenlenebildiği servis sağlayıcılarından yararlanılması uygun bulunmuştur. Google Maps Platformunun Static API özelliği kullanılarak, Python programlama dilinde bir veri üretme programı geliştirilmiştir. Bu programda uydu görüntülerine karşılık gelen maske görüntülerinin özellikleri bir JavaScript koduyla tanımlanmıştır. Yol bölütleme çalışmaları için otomatik bir sabit harita stili oluşturulmuştur. Ayrıca, geliştirilen bu program kullanılarak sabit görüntü boyutlarında ve belirlenen test bölgeleri sınırlarında istenilen sayıda görüntüler rastegele veya dizi halinde üretilebilmektedir. Ayrıca, Google Maps Platform, görüntüler hakkında coğrafi bilgiler sağlamamaktadır. Bu açığı kapatabilmek amacıyla, görüntülerin bilinen merkez pikselinin enlem ve boylamı ile bu görüntülerin jeo-referanslandırma işlemini gerçekleştirebilecek özellikte programa eklenmiştir.

Tezin üçüncü bölümünde, yol bülütleme çalışmalarında test edilen bölgenin karakterini ifade eden veri setinin üretilmesi gerekliliğinin ortaya konulması amacıyla, İstanbul yol veri seti oluşturulması hedeflenmiştir. İstanbul’un yol ağı, sürekli artan nüfus miktarıyla birlikte gelişim halindedir. Bununla birlikte, farklı yol tiplerini ve arazi kullanım detaylarını barındırması nedeniyle derin öğrenmenin ihtiyaç duyduğu veri çeşitliliğini karşılayabilecek düzeydedir. İstanbul’un değişen ve gelişen yapısı, onu sürekli gözlemlenmesi ve incelenmesi gereken önemli bölgelerden biri yapmaktadır. Büyük ölçekli yol bölütleme çalışmalarında genellikle yakınlaştırma düzeyi olarak 16 veya 17 tercih edilmektedir. Ancak, farklı yakınlaştırma seviyelerinin yol bölütleme çalışmalarına getireceği katkıların irdelenmesi açısından 14, 15, 16 ve 17 yakınlaştırma seviyeleri çalışmalara dahil edilmiştir. Bu yaklaşımla, İstanbul’da belirlenen test bölgelerinde, her bir yakınlaştırma seviyesi için 10000 adet optik görüntüsü ve bu görüntülerin yol maske görüntüleri üretilmiştir. Üretilen veri setinin derin öğrenme modellerinde performansını test etmek için, görüntü bölütleme çalışmalarında başarılı sonuçlar elde etmiş olan derin artık U-Net mimarisi kullanılmıştır. Eğitimler sonucunda elde edilen modellerin tahmin metrikleri incelendiğinde, İstanbul veri setinin ayrı ayrı her bir yakınlaştırma seviyesinde yol bölütlemesi açısından başarılı sonuçlar elde ettiği tespit edilmiştir. Ayrıca, çalışma bölgesinin dışında üretilen veri setleriyle gerçekleştirilen eğitimlerle üretilen modellerin İstanbul görüntüleriyle tahmin performansını test edebilmek için, yol bölütleme çalışmalarında yaygın olarak tercih edilen DeepGlobe ve Massachusetts veri setleri analizlere dahil edilmiştir. Bu verilerle eğitilen modellerde İstanbul veri seti test edilmiş ve oldukça düşük tahmin doğrulukları elde edilmiştir. Bu durum, çalışma alanındaki yol ağının yerel özelliklerini yansıtan bir veri seti üretilmesi gerekliliğini ortaya koymuştur.

İstanbul veri seti kapsamlı bir şekilde incelendiğinde, 17 yakınlaştırma düzeyinde üretilen görüntülerin diğer yakınlaştırma düzeylerine göre daha karmaşık piksel ve arka plan yapısına sahip olduğu ve tahmin doğruluğunun olumsuz etkilendiği tespit edilmiştir. Bu kapsamda, iki alternatif model önerilmiştir. İlk yaklaşımda başlangıç ağırlıkları olmaksızın 14 yakınlaştırma seviyesinde eğitim gerçekleştirilmiştir ve bu eğitimden elde edilen ağırlıklar 15 yakınlaştırma seviyesindeki eğitime başlangıç ağırlıkları olarak dahil edilmiştir. Bu yaklaşımla bir önceki yakınlaştırma seviyesinden bir sonraki seviyeye ağırlıkları aktararak 17 yakınlaştırma seviyesine kadar ağrılıkların taşınması gerçekleştirilmiştir. İkinci yaklaşımda ise 17 yakınlaştırma seviyesindeki görüntülere L₀normalizasyon işlemi gerçekleştirilmiştir. Elde edilen sonuçlara göre, ağırlık taşıma yaklaşımında %2’lere ve L₀ yaklaşımıyla tahmin doğruluklarında %3’lere varan artışlar elde edilmiştir. Son olarak, tüm yakınlaştırma seviyelerinde eşit sayıda görüntü içeren yeni bir veri seti oluşturulmuştur. Eğitim sonucunda oluşturulan modelde her bir yakınlaştırma düzeyine ait görüntüler ayrı ayrı test edilmiştir. Yakınlaştırma düzeyi ne olursa olsun modelin amaca uygun olarak otomatik yol bölütleme çalışmalarında kullanılabilecek başarılı bir model olduğu sonucuna varılmıştır.

Yol bölütlemesi çalışmaları, sadece optik görüntülerin kullanılması, kentsel alanlardaki binaların ve objelerin oluşturduğu gölgeler ve bu nesnelerin yol üzerinde meydana getirdiği engellemeler nedeniyle olumsuz etkilenmektedir. Bu sorunlar, özellikle yüksek çözünürlüklü uydu görüntüleri kullanıldığında daha çok meydana gelmektedir. Ayrıca, özellikle kırsal alanlarda, ağaçların yolları kaplaması bir diğer hata kaynağıdır. Problemlerin çözümünde derin öğrenme modellerinin geliştirilmesinin yanı sıra, sadece uydu görüntülerinin kullanılması yerine uydu görüntülerinin eksikliklerini giderilmesi gerekmektedir. Bu amaçla, farklı türde veriler çalışmalara dahil edilerek modellerin ihtiyaç duyduğu veri gereksiniminin karşılanması sağlanabilir. Bu verilere örnek olarak ele alınabilecek LiDAR verisi, objeler hakkında detaylı bilgiler sunmaktadır. Ayrıca, optik görüntülerde meydana gelen sorunları barındırmadığı için uydu görüntüleriyle birlikte kullanılmasının gerçekleştirilebilmesi halinde yol bölütleme çalışmalarında daha başarılı modeller üretilebilir.

Bu tezin dördüncü bölümünde, tespit edilen problemlerin çözülebilmesi amacıyla optik görüntüler ile LiDAR nokta bulutunun birlikte kullanılabilirliği irdelenmiştir. Bu birleşimin gerçekleştirilmesinde özellik düzeyinde birleşim stratejisinin kullanılması önerilmiştir. Bu stratejide, optik görüntülerin özellikleri derin öğrenme tabanlı modellerden hesaplanırken, LiDAR nokta bulutunun özellikleri 3B geometrik ilişki oluşturularak hesaplanmıştır. Optik görüntüler ve bu görüntülerin yol maskeleri içeren verinin temininde, bu tezin üçüncü bölümünde geliştirilen veri üretim altyapısı kullanılmıştır. Önerilen birleşim stratejisinde, optik görüntülerin özellikleri doğrudan derin öğrenme modelinden hesaplanmıştır. Ancak, 3B nokta bulutu düzensiz bir yapıdadır ve bu yapıdan anlamlı bilgiler çıkartılması için bir dizi ön işleme adımına tabi tutulması gerekmektedir. Noktaların komşularıyla özellik vektörleri oluşturarak bağlamsal bilgi elde edilmektedir. Bu kapsamda, her bir noktanın 3 boyutlu komşuluk ilişkilerinin belirlenmesi ve bu komşuluklara bağlı geometrik özelliklerin hesaplanması gerekmektedir. Her bir nokta için k-en yakın komşuluk (KNN) algoritması kullanılarak komşulukları belirlenmiştir. Bu komşuluklara bağlı olarak 8 adet özdeğer vektörüne ve 5 adet 3B geometrik özelliklere bağlı olmak üzere toplamda 13 adet LiDAR özelliği hesaplanmıştır. Bu hesaplanan özelliklerin, optik görüntü özellikleri ile birleştirilebilmesi için LiDAR özelliklerinin 2B özellik görüntülerine dönüşümü gerçekleştirilmiştir. Optik görüntülerin girdi olarak verildiği derin artık U-Net modelinde son konvolüsyon katmanının öncesinde, yüksek seviye optik görüntü özelikleri ile hesaplanan LiDAR özellikleri, özellik düzeyinde birleştirilmiştir.

Ayrıca, U-Net modelinin kodlayıcı bloklarına daha derin özellik çıkarımı gerçekleştirebilen ResNet sinir ağı eklenmiştir. Her biri farklı analiz olacak şekilde entegre edilen ResNet (18, 34, 50 ve 152) mimarileriyle özellik düzeyinde birleşimin performans tutarlılığı irdelenmiştir. Elde edilen sonuçlara göre görüntü ve LiDAR birleşimi, yol bölütleme konusunda tüm analizlerde %1'den %5'e kadar metrik istatistiklerini artırarak daha iyi performans gösterdiği tespit edilmiştir. Bununla birlikte, tek tek oluşturulan tahmin görselleri incelendiğinde, birleşim yönteminin ağaçların olduğu alanlarda yol geometrisinin tamamlanmasına yardımcı olduğu tespit edilmiştir. Bu yöntemle, ağaçlık ve gölge etkilerinin oluştuğu alanlarda derin öğrenme modelinde yalnızca uydu görüntülerinin kullanılmasına nazaran daha iyi bir doğruluk ve kalitede yol piksellerinin bölütlenmesini gerçekleştirildiğini göstermiştir.

Sonuç olarak, çalışma alanına özel optik görüntüler ve bu görüntülere karşılık gelen yol maske görüntüleri üretebilen program geliştirilmesi ile derin öğrenme tabanlı yol bölütlemesi çalışmalarında ihtiyaç duyulan yüksek miktarda verilerin üretiminin daha hızlı gerçekleştirilmesi sağlanmıştır. Ayrıca, jeo-referanslı veri üretim altyapısının geliştirilmesi, üretilen veri setlerinde elde edilen optik görüntülerin, özellikle farklı kaynaklardan elde edilen verilerle kullanılabilirliğini mümkün kılmıştır. Üretilen veri setleri ile eğitilen derin öğrenme modellerinin performansları, hem yol bölütleme çalışmaları için başarılı sonuçlar elde edilmesini sağlamış hem de çalışma alanını karakteristiğini temsil eden verilerin gereksinimini karşılamıştır. Bununla birlikte, optik görüntülerdeki yol piksellerinin ağaç veya gölge gibi sebeplerden engellenmesinden kaynaklı derin öğrenme modellerinin tahminlerindeki problemler, önerilen farklı kaynaklı verilerin özellik düzeyinde birleşim stratejisi ile başarılı bir şekilde giderilmiştir.