Bilgisayarlı görme teknolojilerinde değişim başlıyor

Göz izleme ve diğer insan-bilgisayar etkileşimi uygulamaları için geliştirilen bilgisayarlı görme teknolojileri üzerinde çalışan bilim insanlarından son gelişmeleri Independent Türkçe'ye anlattı

Görsel: spainter_vfx

İnsanın görme yetisinden ilham alınarak tasarlanan ve bilgisayarların veri depolama, işleme ve görüntülemedeki üstünlüklerinden faydalanan bilgisayarlı görme sistemleri birçok alanda kullanılıyor. 

Yapay zeka alanının alt başlıklarından biri olan bilgisayarlı görme sayesinde etrafımızdaki nesneleri dijital kameralar vasıtasıyla algılayıp tanımlayabilen sistemler geliştiriliyor. 

1950'li yıllarda göz izleme teknolojisi askeri alanda da kullanıldı ve pilotaj hatası nedeniyle meydana gelen kazaların önlenebilmesi için, savaş pilotlarının çeşitli manevralar sırasında kokpitteki göstergelere ne sırada ve sıklıkta baktıkları araştırıldı. 

Günümüzde de otonom araçlar önceden belirlenen bir rotayı takip ettiği esnada karşısına çıkabilecek engelleri bilgisayarlı görme ile saptayıp, hızla alternatif bir rota belirleyerek güvenli bir şekilde hedefine varabiliyor. 

Helikopter pilotlarının kasklarına yerleştirilen artırılmış gerçeklik gözlükleri de bu yöntem sayesinde pilotun görüş alanının ötesindeki nesneleri daha rahat tanımlamasını ve uçuş bilgilerine gözlük üzerinden ulaşmasını sağlıyor. 

Günümüzde göz izleme teknolojisinin, reklamcılık ve eğitim gibi gündelik hayata daha yakın birçok kullanımı da mevcut.

Göz izleme ve diğer insan-bilgisayar etkileşimi uygulamaları için geliştirilen bilgisayarlı görme teknolojileri üzerinde çalışan bilim insanlarından son gelişmeleri öğrendik.


Göz izleme teknolojisiyle algımız için daha az yorucu sistemler geliştiriliyor

Marmara Üniversitesi Bilgisayar Mühendisliği bölümünden sonra Münih Teknik Üniversitesinde yüksek lisans eğitimini tamamlayan Dr. Kenan Bektaş, bir süre Princeton, New Jersey'deki bir ARGE biriminde araştırmalara katıldı.

Dr. Bektaş, Zürih Üniversitesi'nde göz izleme teknolojisi yardımıyla dijital hava fotoğrafların daha verimli görüntülenmesi ile ilgili ve bu teknolojinin insan makine etkileşimindeki rolü üzerine çalışmalar yürütüyor.
 

Dr. Kenan Bektaş.jpg
Dr. Kenan Bektaş


İnsanların nereye baktığını anlık olarak saptayabilen göz izleme ekipmanları üzerine çalışmalar yapan Bektaş, "İnsan gözü sürekli hareket halinde. Gözlerimiz bu hareket sırasında sabit bir noktaya odaklandığında yüksek düzeyde görsel detay algılar. Bu noktanın dışında kalan bölümde ise, daha düşük derecede detay algılar" diyor. 

"Eğer dijital bir ekran üzerinde bakmadığımız yerleri anlık olarak tespit edebilirsek, ekranın o bölümlerinde yüksek çözünürlük kullanmamıza gerek kalmaz" diyen Dr. Bektaş, "Gözün odaklanma noktasına duyarlı olarak çalışan sistemler, göz izleme teknolojisinden faydalanıyor. Böylece ekran üzerinde bakmadığımız alanları flu olarak görselleştiriyor. Bu algımız için daha az yorucu olabiliyor. Bu tip sistemler benzer şekilde kullanıcının ekran üzerinde bakmadığı yerleri daha belirgin hale getirmek için de kullanılabilir" şeklinde bilgi veriyor. 


"Kullanıcıların ekran başında daha verimli çalışmasını sağlayabiliriz"

Bu yöntem sayesinde kullanıcının dikkatinden kaçan ayrıntıları fark etmesini sağlanabildiğini söyleyen Bektaş, bu teknik hakkında şu bilgileri paylaşıyor:

Bir kimsenin nereye baktığını göz izleme teknolojisiyle takip edip, bazı durumlarda kullanıcıların ekran başında daha verimli çalışmasını sağlayabiliriz. Yaptığımız deneyler sonucunda bu savı destekleyen bulgulara ulaştık. Deneylerimize katılan kişilere, yüksek çözünürlük ve detaydaki onlarca hava fotoğrafını incelemelerini ve o fotoğraflarda çeşitli nesnelerin varlığını ve yerini tespit etmelerini istedik. Katılımcıların bakmadığı yerlerdeki detayları azalttığımız durumlarda aradıkları nesneleri daha çabuk bulabildiklerini saptadık ve aldığımız sonuçları çeşitli bilimsel makalelerde yayımladık.


"Okuma zorluğu ve dikkat eksikliği olan bireylerin günlük etkinliklerini kolaylaştırıcı çözümler sunulabiliyor"

Bilgisayarlı görme yöntemleriyle, hareketli nesnelerin bilgisayar vasıtası ile anlık konum ve hızını hesaplayabildiklerini belirten Dr. Bektaş, sözlerini şöyle sürdürüyor:

Göz izleme teknolojileri kızılötesi kameralar yardımı ile kaydedilen göz hareketlerini bilgisayarlı görme yöntemleri kullanarak yüksek hassasiyetle ölçmemize yarıyor. Bu sayede herhangi bir görsel üzerinde hangi alanlara daha uzun süre dikkatimizi verdiğimizi, nereye bakmadığımızı ya da görmezden geldiğimizi, ortamda birden fazla nesne varsa bu nesnelere hangi sıra ile baktığımızı hesaplayabiliyoruz. Göz hareketleri incelenerek okuma zorluğu (Disleksi), dikkat eksikliği (ADHD) olan bireylerin günlük etkinliklerini kolaylaştırıcı çözümler sunulabiliyor. Bir makine operatörünün ya da uçuş eğitimi alan bir pilotun stres seviyesi anlık saptanabiliyor.
 

Dr. Kenan Bektaş'ın araştırmalarından.jpg
Dr. Kenan Bektaş'ın araştırmalarından

 

Gözümüzün önündekini neden görmeyiz?

İsviçre St. Gallen Üniversitesi'nin Bilgisayar Bilimleri Enstitüsü'nde göz izleme teknolojisini artırılmış gerçeklik teknolojisi ile birleştiren endüstriyel uygulamalar üzerinde çalışan Bektaş, "Mesela önemli bir toplantıya yetişmek üzere evden çıkacakken, gözlüğünüzü ve anahtarınızı bulamadığınızı düşünün. Zaten stresli olduğunuzdan telaş içerisinde aradığınızı bulma süreniz uzayabilir. Bunun yanında odanız ya da masanız dağınıksa, irili ufaklı boyutlarda ve çeşitli renklerdeki onca nesne arasında ufak bir anahtarı bulmanız da zaman alır. Yani görsel algıya dayalı verdiğimiz kararlara, görme yetimizin ve bozukluklarımızın, o anki duygusal halimizin yansıra etkileşimde olduğumuz ortamın aydınlatma sistemi ve o ortamdaki nesnelerin durum ve düzeni etkili oluyor" şeklinde konuşuyor. 


"Makine operatörlerinin göz hareketlerindeki değişimi saptayıp, daha verimli çalışmasını sağlayabiliriz"

Dr. Kenan Bektaş, çalışmaları üzerine şu bilgileri veriyor:

Göz izleme ve sanal gerçeklik teknolojilerini birleştiren (Hololens) sistemler kullanarak makine operatörlerinin daha güvenli şartlarda çalışması için araştırma yapıyoruz. Bu sistemler yapay zeka başlığı altında geliştirilen çeşitli çözümleri içeriyor. Öncelikle göz izleme teknolojisi sayesinde makine operatörünün göz hareketleri ve göz bebeği büyüklüğündeki değişimi saptayıp, dikkat seviyesini ölçebiliriz. Bunun yanında bilgisayarlı görme sayesinde çalışma ortamında operatörün dikkatinden kaçmaması gereken nesneleri ya da dikkatini dağıtacak çevresel etkenleri saptayabiliriz.


Edindikleri bu tip verileri makine öğrenmesi yöntemleri ile analiz ettiklerini söyleyen Bektaş, "Oluşabilecek tehlikeli durumlar hakkında çıkarım yapabiliriz. Operatörü, artırılmış gerçeklik gözlüğü vasıtası ile bilgilendirebilir ya da onu potansiyel tehlikeli durumlar hakkında uyarabiliriz" ifadelerini kullanıyor.


"Göz izleme sistemleri sayesinde bir kişinin nereye odaklandığını saptayabiliyoruz"

"Görsel algı esnasında gözlerinizin optik olarak odaklandığı nokta ile dikkatinizi verdiğiniz nokta örtüşmeyebilir" diye belirten Bektaş, bunun dışında kalan durumlarda göz izleme sistemleri sayesinde bir kişinin nereye odaklandığını düşük bir yanılma payı ile saptayabildiklerini aktarıyor.

Bektaş ayrıca, "Bu konuda son yıllarda yapılan çalışmalar gösteriyor ki göz bebeği büyüklüğü ile orantılı olarak kişinin stres ve kaygı durumunu ölçmek de mümkün. Bu nedenle göz izleme ve sanal gerçeklik teknolojilerini birleştiren sistemlerin kullanım alanının giderek artacağını tahmin ediyoruz" diyor. 


"Ürünleri etiketlemek; bilgisayarlı görme, dijital üretim ve derin öğrenme metotları ile son bulacak"

Boğaziçi Üniversitesi Elektrik-Elektronik Bölümünden mezun olduktan sonra UCLA'de ve Stuttgart'taki Max Planck Akıllı Sistemler Enstitüsü'nün Fiziksel Zeka Departmanında araştırma projelerine katılan Mustafa Doğa Doğan, Massachusetts Teknoloji Enstitüsü'nün (MIT) Bilgisayar Bilimi ve Yapay Zeka Laboratuvarı'nda (CSAIL) doktora çalışmalarını sürdürüyor.  
 

Mustafa Doğa Doğan.jpg
Mustafa Doğa Doğan

 

İnsan-bilgisayar etkileşimi (HCI) alanında çalışan Doğan, günlük hayatımızdaki nesnelerin ve malzemelerin göze batmayan fiziksel özelliklerini etiket olarak kullanan akıllı algılama sistemleri geliştirdiğini söylüyor.

Bu teknolojilerin bilgisayar ve diğer makineler sayesinde çevremizi ve insan hayatını daha iyi kavrayabilmelerini sağladığını kaydeden Doğan, "Onları daha akıllı hale getiriyor. Fiziksel nesnelerin algılanması ve tanımlanması, özellikle fiziksel ve sanal dünyalarımızı harmanlamayı amaçlayan arttırılmış ve sanal gerçeklik (AR/VR) gibi teknolojiler için yeni etkileşimlerin geliştirilmesine imkan sağlıyor" şeklinde konuşuyor. 
 

Tanimlama Sistemi.jpg
Tanımlama sistemi

 

"Bu etiketler nesnenin orijinal tasarımının bir parçası oldukları için, fiziksel zarar görmez"

"Nesnelerin mikroskobik yüzey profilini bir 'doğal kimlik' olarak kullanabiliriz" diyen Doğan, sözlerini şöyle sürdürüyor:

Elektronik cihazlar tarafından okunabilen ve veri içeren etiketler günümüzde birçok ürünün ve objenin halihazırda önemli bir bileşenidir. Neredeyse etrafımızdaki her ürün bir barkod içerir. Bu tür etiketlerin ürünün ambalajına yapıştırılması gerekir. Bunlar genellikle görsel estetiği bozar ve ayrıca sadece bir kağıt parçasından oluştuğu için kolayca hasar alabilir.

Ben bu tarz 'harici' etiketler yerine, nesnelerin ve malzemelerin fiziksel ve göze batmayan özelliklerini etiket olarak kullanan tanımlama sistemleri geliştiriyorum. Bu etiketler nesnenin orijinal tasarımının bir parçası oldukları için, fiziksel zarar görmez, nesnenin görünümünü etkilemez ve başkası tarafından müdahale edilemez ya da kurcalanamazlar. Bunların tasarımı ve geliştirilmesi için bilgisayarlı görme, dijital üretim ve derin öğrenme metotlarını kullanıyorum.

 

SensiCut-3.JPG
SensiCut projesi

 

"Derin öğrenme ile 30 farklı materyal türünü yüzde 98 oranında doğrulukla sınıflandırabiliyoruz"

"SensiCut" adlı bir proje geliştirdiklerini belirten Doğan, "Düşük maliyetli bir lazer ve kamera kullanarak farklı materyalleri, yüzey profillerinin oluşturduğu lazer benek desenini yapay bir sinir ağı ile sınıflandırarak ayırt edebiliyoruz. Bu şekilde 30 farklı materyal türünü, renk ve görünüş olarak birbirine benzeseler bile yüzde 98 oranında doğrulukla sınıflandırabiliyoruz. Derin öğrenme sayesinde bu yöntem yalnızca tek bir kamera gerektiriyor. Önceki yöntemlere kıyasla birden çok sensör kullanmaya gerek kalmıyor. Bu metot, lazer kullanan birçok elektronik ürüne entegre edilebilir. Mesela, lazer kesiciler bu sayede kestikleri materyalleri otomatik olarak tanıyabilir ve böylece onu optimal şekilde kesebilirler. Makalemizde bu endüstriyel uygulamanın faydalarını çeşitli örneklerle gösterdik. Mesela görünüş olarak diğer materyallere benzeyen, fakat ısıya maruz kalınca sağlığa zararlı gazlar yayan plastikler, eğer eksper olmayan bir kullanıcı tarafından lazer kesicinin içine konulursa makine bunu otomatik olarak algılayabilir ve kullanıcıyı uyarabilir" diyor.
 

SensiCut.jpg
SensiCut

 

Doğan, projenin detaylarını şu şekilde örneklendiriyor:

Örnek olarak, akrilik, polikarbonat ve PVC görünüş olarak birbirine benzer fakat sadece akrilik lazer kesici tarafından güvenli olarak kesilebilir. Farklı bir uygulama olarak lazer kesici, farklı malzeme parçalarından oluşan bir nesnenin yüzeyini bu yöntemimiz sayesinde tarayabilir ve her bir parçayı doğru ayarları kullanarak incelikle işleyebilir. Mesela cihazın içine tahta, plastik, tekstil gibi farklı parçalardan oluşan telefon kabınızı veya çantanızı koyabilirsiniz. Bilgisayarınıza 'bunun üzerine şu deseni ya da fotoğrafı tek parçada bas' diyebilirsiniz. İleride IPhone gibi yüz tanıma sensörü (FaceID) içeren telefonlar da halihazırdaki lazer modülünü materyal tanımlaması yapmak için kullanabilir.


"Taklit edilen ürünleri telefon kamerası kullanarak birbirinden ayırt edebiliriz"

"2020 ACM CHI Bilişim Sistemlerinde İnsan Faktörleri Konferansı'nda yayımlanan diğer bir makalemde ise, nesnelerin imalat kusurlarına bakılarak ayırt edilmesini sağlıyor" diyen Doğan, projeye dair şu bilgileri paylaşıyor:

G-ID adlı bu projede, 3 boyutlu yazıcıların cisimleri oluştururken izledikleri yol sonucu ortaya çıkan yüzey kusurlarını bilgisayarlı görme metotları kullanarak algılayabiliyoruz. Bu sayede aynı gözüken fakat her biri farklı bir imalat kusur 'kimliği' içeren on binlerce obje kopyasını, sadece bir telefon kamerası kullanarak birbirinden ayırt edebiliriz. Bu teknik, kullanıcı tanımlama, kimlik belirleme uygulamalarında kullanılabilir ve ürün taklitçiliğine karşı koruma sağlayabilir.
 

 

Her nesne kendisi hakkında bilgi taşıyacak

"Veri hakkında veri" diyerek meta veri veya üst veriler kavramını tanımlayan Doğan, "Günümüzde bu veriler birçok dijital dosyada hali hazırda yer alıyor. Mesela, bir fotoğraf makinesi çektiği her dijital fotoğraf dosyasının içine fotoğrafın çekildiği tarih ve GPS konumu, fotoğraf makinesinin modeli ve ayarları gibi çeşitli bilgileri kaydediyor. Buna meta verileri deniyor" diyor.  

Bilgisayarlı görme teknikleri sayesinde ileride her fiziksel nesnenin de bir meta veriye sahip olacağını kaydeden Doğan, dijital ortamdaki bu yaklaşımı fiziksel nesnelere aktarmak için geliştirilen "fiziksel etiketler" sayesinde ileride bu gibi bilgileri içeren gizli gömülü meta verilere kolayca erişebileceğini söylüyor. 

 

© The Independentturkish

DAHA FAZLA HABER OKU