Massachusetts Teknoloji Enstitüsü (MIT) Profesörü Joseph Weizenbaum, 1966'da ilk sohbet botu ELIZA'yı geliştirdiğinde insanların dijital dünyayla etkileşimini kökünden değiştireceğinin farkında mıydı?
Sohbet botları ELIZA'dan beri hayatımızda. Birçok kişi bilerek veya bilmeyerek onları (örneğin sesli asistanlar) bugüne dek kullandı.
Ancak 2022'de ABD'li yapay zeka firması OpenAI'ın piyasaya sürdüğü ChatGPT, hem internette bilgi arama anlayışımızı hem de mesleklerimizi icra etme biçimimizi değiştirdi.
Sohbet botları, kullanıcılarla genellikle metin, bazı durumlardaysa sesli konuşma yoluyla diyalog kurarak istenen konularda bilgi veren veya talep edilen işlemleri yerine getiren yazılımlara deniyor.
ChatGPT, birçok uzmana göre bu alanda çığır açıcı bir atılım olsa da üretken yapay zeka dünyasında yalnız değil. Hatta buzdağının sadece görünen yüzü.
Google, Microsoft ve Meta gibi dev şirketlerin de hızla dahil olduğu yapay zeka yarışı kısah sürede son derece kullanışlı yazılımların hayatımıza girmesini sağlayarak sürüyor.
Üretken yapay zeka nedir?
Metin, görüntü ve ses gibi çeşitli içerik türleri üretebilen yapay zeka sistemlerin tümüne üretken yapay zeka (generative AI) adı veriliyor. Bu teknoloji ilk kez 1960'larda sohbet botlarıyla tanıtıldı.
fazla oku
Bu bölüm, konuyla ilgili referans noktalarını içerir. (Related Nodes field)
İlk büyük sıçramayı ise 2014'te GAN'ların piyasaya sürülmesiyle yaptı. İnsan beyninin öğrenme biçimini taklit eden derin sinir ağlarıyla oluşturulan son derece gerçekçi insan yüzlerine GAN adı veriliyor. GAN'ların ortaya çıkışından önce, yapay zekanın inandırıcı ve özgün görüntüler, videolar ve sesler oluşturabilmesi mümkün değildi.
Bu teknoloji 2021'de DALL-E ve ardından Stable Diffusion, Midjourney ve Runway gibi görsel üretim mekanizmalarının piyasaya sürülmesini sağladı. Böylece üretken yapay zeka araçları dünya genelinde büyük yankı uyandırabildi.
Bunu 2022'de sohbet botu ChatGPT'nin duyurulması izledi. ChatGPT, üretken yapay zeka araçlarına yönelik ilginin de zirve yapmasını sağladı.
Sohbet botları
Yukarıda da bahsedildiği üzere sohbet botları üretken yapay zekanın ilk ve en önemli dallarından. Bunların arkasında GPT (Generative Pre-trained Transformer / Üretken Ön İşlemeli Dönüştürücü) adı verilen ve genelde doğal dili işlemek kullanılan açık kaynaklı bir yapay zeka modeli var.
Bu dil modelleri adından da anlaşılacağı üzere transformer (dönüştürücü) isimli bir yapay mimarisini kullanılıyor ve milyonlarca metin verisiyle eğitiliyor. Bunlar arasında kitaplar, makaleler ve şiirler de var.
İlk transformer ağı 2017'de geliştirildi. O zamandan beri sohbet botları büyük bir hızla gelişim gösteriyor.
ABD'li OpenAI firmasının geliştirdiği ChatGPT bu botların muhtemelen en sansasyonel örneği oldu. Zira sohbet botunun 1 milyon kullanıcıya ulaşması yalnızca 5 gün sürdü.
Sadece iki ay sonra ise aylık 100 milyon aktif kullanıcı toplar hale geldi. Bu da onu tarihin en hızlı büyüyen uygulaması kılıyor. TikTok'un 100 milyon kullanıcıya ulaşması 9 ay, Instagram'ın ise iki buçuk yıl sürmüştü.
Uzmanlar halen ChatGPT'nin popülaritesinin ardındaki sırları tartışıyor.
Center for American Progress'te teknoloji politikalarından sorumlu başkan yardımcısı Adam Conner, bu başarıyı sistemin halkın anlayabileceği bir formatta halka sunulmasına bağlıyor.
Conner, "ChatGPT'den farklı olan şey, sistemin sadece bir tür kod veya veri çıkışı yerine sıradan insanın anlayacağı şekillerde çıktılar üretmesi" diyor.
Sohbet botunun devrim niteliğindeki bir diğer özelliği de kullanıcılarla ettiği sohbetlerden öğrenmemesi. Zira bot, piyasaya sürülmeden önce eğitimini tamamlıyor. Bu sayede sistemin arkasındaki ekip, ırkçı ifadeleri, küfürleri ve istenmeyen diğer çıktıları önceden filtrelemiş oluyor.
Bu durum, sohbet botları için önemli bir kilometre taşı oldu. Örneğin, daha önce Meta'nın sohbet botu BlenderBot3, kullanıma açıldıktan sonraki iki gün içinde komplo teorileri üretmeye ve Yahudi düşmanı yorumlar yapmaya başlamıştı. Aynı şekilde Galactica adlı bir diğer programı da halka açıldıktan yalnızca iki gün sonra tehlikeli yorumlar yapar hale gelmişti. Firma bunun ardından programı kapatmak zorunda kalmıştı.
ChatGPT'nin piyasaya sürülmesinin ardından şirketler, bu tür denemeleri artık yapmaz hale geldi. Bugün genellikle önceden eğitilmiş programları piyasaya sürmeyi tercih ediyorlar.
Öte yandan ChatGPT'nin halihazırda birçok eksiği var. Örneğin, kullandığı metinlere kaynak vermemesi en önemlilerinden. Bu nedenle arama motoru işlevi görmesi de zorlaşıyor. Zira kullanıcılar hem intihal hem de yanlış bilgi riskiyle karşı karşıya kalıyor.
Bu eksiklikleri iyi değerlendiren diğer birçok yapay zeka şireti, kullanıcının amacına yönelik araçlar geliştirdi.
1. Perplexity AI
Perplexity AI tam da yukarıda bahsi geçen kaynakça problemini çözmek için tasarlanmış bir sistem.
Bu sistem arama motorlarına daha yakın bir deneyim sunsa da arayüzü sohbet botu şeklinde. Sistem özellikle akademisyenlerin ve öğrencilerin işine yarayabilecek özelliklere sahip.
Botun "focus" (odak) butonuna tıkladığınızda arama alanını özelleştirmek mümkün. Örneğin kullanıcılar çıkan seçeneklerden birini işaretleyerek sadece akademik makaleler içinde veya Wikipedi'de arama yapabiliyor.
Sistemin ayrıca internete erişimi var. Yanıtları doğrulamak için Bing tabanlı bir bilgi çekme sistemi kullanıyor. Bu da ChatGPT'nin aksine güncel bilgilere erişebildiği anlamına geliyor.
Üstelik Perplexity, Microsoft'un Bing hizmetinden önce piyasaya sürüldü. Ayrıca bilginin doğruluğu açısından hem ChatGPT hem de Bing'den daha iyi performans gösterdiği görülüyor.
Perplexity'nin Copilot adı altında yeni bir özelliği de var. Copilot, akıllı bir arama süreci sağlayarak, etkileşimli biçimde arama motoruna yazacağınız soruları özelleştirmenizi sağlıyor.
Örneğin, yeni bir kulaklık satın almak için Perplexity AI Copilot'tan yardım istemek istiyorsanız, size önce ne tür kulaklık aradığınızı, hangi özelliklere sahip olmasını istediğinizi ve bütçenizi soruyor. Daha sonra bu parametreleri kullanarak internette arama yapıyor ve yanıt buluyor.
Copilot halihazırda ücretsiz. Fakat bu özellik GPT-4 dil modelini kullandığı için kullanımı sınırlı. Kullanıcılar 4 saatte bu özelliği sadece 5 kez kullanabiliyor.
2. Microsoft Bing
Microsoft geçen şubat, OpenAI'ın GPT-4 dil modeliyle desteklenen yeni nesil arama motoru Bing'i tanıttı. Bing aslında ilk kez 2009'da geliştirilmişti ama Microsoft ve OpenAI ortaklığında yapay zeka desteği kazanana dek yankı uyandıramadı.
Şirket, OpenAI'la uzun vadeli ortaklığını pekiştirmek için ocak ayında büyük bir anlaşma yaptıklarını duyurmuştu. Medyada Microsoft'un yapay zeka şirketine 10 milyar dolar verdiği iddia edilmiş ama söylentiler doğrulanmamıştı.
Kullanıcılar Bing'e girdiğinde tıpkı Microsoft Edge gibi bir arama motoruyla karşılaşıyor. Burada haberler, videolar ve haritalar gibi alışılagelmiş alt başlıklar mevcut. Bu başlıklardan ilkindeyse "Chat" yazıyor. İşte bu seçenek, kullanıcıları Bing'in yapay zekalı sohbet botuna yönlendiriyor.
Bing'de sohbet botuna tıpkı ChatGPT gibi sorular sorabiliyorsunuz. Ancak ondan farklı olarak, kullanıcılara arama sonuçlarıyla ilgili üç seçenek sunuluyor: Daha yaratıcı, daha dengeli ve daha kesin sonuçlar.
Bing'in sunduğu bilgilerin doğruluğunu teyit etmek, kaynak göstermesi sayesinde kolaylaşıyor. Ancak Perplexity gibi akademik araştırmalarda kullanılabilecek seviyeye ve seçeneklere sahip değil.
Diğer yandan iddialı çıkışına rağmen programın beklentileri karşılayamadığı da görülüyor. Yapay zekalı Bing'in Google'ı tarihe gömeceği iddia ediliyordu. Ancak küresel arama motoru pazarındaki payı, Bing Chat’in tanıtılmasından bu yana düşüyor. Bu yılın ocak ayında yüzde 3'lük paya sahip olan Bing, ağustos itibarıyla yüzde 2,9 seviyelerinde.
3. Google Bard
Google'ın mart ayında erken erişime sunduğu, daha sonra da herkese açık hale getirdiği yapay zeka botu Bard, hem ChatGPT'nin hem de Bing'in en büyük rakibi konumunda.
ChatGPT'nin piyasaya sürülmesinden beri yapay zeka sohbet botlarının yeni arama motorları haline geleceği ve Google'ı tahtından edeceği tartışılıyordu. Google buna cevaben, Bard'ı bir arama motoru olarak kurgulamadıklarını, arama sonuçlarını iyileştiren bir asistan olarak gördüklerini söylüyor.
Bard'da kullanılan model Google’ın kendi dil modeli LaMDA'ya dayanıyor. Şirket, bu sohbet botunu LaMDA'yı geliştirmek üzere geri bildirim toplamak için de kullanıyor.
LaMDA daha önce Google'ın eski mühendisi Blake Lemoine'nin iddialarıyla gündeme gelmişti. Mühendis, LaMDA sisteminin bilinç kazandığını ve 8 yaşındaki bir çocuğun zekasına sahip olduğunu öne sürerek manşetlerde yer bulmuştu.
Bard son olarak, şirketin siteye eklediği bir uyarıyla da gündeme geldi. Uyarıda "Adım Bard, amacım size yaratıcı bir şekilde yardımcı olmak. Şu an bazı sınırlamalarım olduğu için her zaman doğru yanıt veremeyebilirim. Ancak geri bildirimlerinizi paylaşarak daha iyi hale gelmeme yardımcı olabilirsiniz" deniyor.
Bunun yanı sıra şirket, kendi programı Bard da dahil olmak üzere yapay zeka sohbet botlarına karşı çalışanlarını da uyarmıştı. Reuters'ın 4 farklı kaynağa dayandırdığı habere göre, teknoloji devi gizli bilgileri ve materyalleri sohbet botlarına göndermemeleri için çalışanlarına komut vermişti.
4. Llama
Llama, Mark Zuckerberg'ün ve dolayısıyla Meta'nın yukarıda bahsi geçen bir dizi başarısız denemenin aksine ses getirmeyi başaran uygulaması.
Bu uygulamanın da ardında Meta'nın Microsoft'la işbirliği yatıyor. İki şirket kısa süre önce sohbet botunun ileri sürümü Llama 2'yi paylaştı. Sistem 29 Temmuz'da herkesin kullanımına açıldı.
Ayrıca Çinli e-ticaret devi Alibaba'nın da Llama 2'yi platformuna entegre etmeye hazırlandığı öğrenildi.
Llama'yı diğerlerinden ayrıştıran en önemli özellik açık kaynaklı olması. Kaynak kodun telif hakkı sahibinin, yazılımı herhangi birine ve herhangi bir amaçla kullanma, inceleme, değiştirme ve dağıtma haklarını verdiği sistemlere açık kaynak kodlu yazılım (open-source software) adı veriliyor.
Bu da isteyen herkesin Llama'yı kendi bilgisayarına kurarak özelleştirebileceği veya geliştirebileceği anlamına geliyor. Meta'nın küresel ilişkiler başkanı Nick Clegg, sohbet botunu açık kaynak yapmanın, geliştiricileri onu incelemeye teşvik ederek sistemi "daha güvenli ve daha iyi" hale getireceğini söylüyor.
Yine de sıradan kullanıcılar için sistemi bilgisayara kurmak zor olabilir. Zira bu, belli bir miktar kodlama bilgisi de gerektirebiliyor.
Diğer yandan bu gibi durumlar karşısında çözümler sunan ve çeşitli sohbet botlarını bünyesinde toplayan bir site mevcut. Poe adlı bu site ünlü internet forumu Quora tarafından geliştirildi ve bünyesinde Llama 2'ye de yer veriyor. Dolayısıyla Poe üzerinden sisteme erişmek çok kolay.
5. Aria AI
Üretken yapay zeka alanındaki yarışa kayıtsız kalamayan bir diğer şirket de Opera Software oldu. Şirket haziran ayında Opera tarayıcısının yapay zekayla desteklenmiş hali olan Opera One'ı duyurmuştu.
Opera One, ChatGPT entegrasyonu sayesinde sohbet botuna hızlı erişim sağlarken, şirketin kendi botu Aria'yı da içeriyor.
Tarayıcının sol tarafındaki kenar çubuğunda yer alan Aria, kullanıcıların sorularını gerçek zamanlı bilgileri kullanarak yanıtlıyor.
Aria tıpkı Bing ve Bard gibi arama motoru deneyimini daha kolay ve hızlı hale getirme hedefiyle tasarlanmış. Örneğin, kullanıcılar bir makale okudukları sırada gördükleri bir terimi hızlıca yan taraftaki Aria'da aratabiliyor ve anlamını ayrıntılı olarak öğrenebiliyor.
Diğer yandan o da, Bing'in aksine, verdiği cevaplarda herhangi bir kaynakça kullanmıyor.
6. Teach Anything
GPT-3.5-TURBO teknolojisini kullanan Teach Anything, kullanıcıların dil zorluk seviyesini belirlemesine olanak tanıyarak öne çıkıyor. Bu program ChatGPT için geliştirilen bir ikinci katman çözümü olarak öne çıkıyor.
Kullanıcı, soruyu yazdıktan sonra ilk olarak dil seçeneklerinden birini işaretliyor. Ardından oluşturulacak cevabın karmaşıklık seviyesine göre kolay veya zor seçeneklerinden birini seçiyor.
Öte yandan bu aracın dil seçenekleri arasında Türkçe yok.
Görsel üretim araçları
Aslında kullanıcı dostu yapay zeka alanındaki büyük patlama, 2021-2022'de kullanıma açılan, yazılı komutlar girip çeşitli stillerde görseller oluşturmaya yarayan araçlarla meydana geldi. Bunlar genellikle "difüzyon modeli" diye anılan karmaşık bir süreci son derece kolay arayüzlerle internet kullanıcılarının kullanımına sunuyor.
İnternetteki binlerce görselle eğitilen difüzyon modelleri, veriyi ilk önce beyaz gürültü ekleyerek bozuyor ve daha sonra bozduğu veriyi geri döndürerek görseller oluşturuyor. Bu araçların en popülerleri DALL-E, Midjourney ve Stable Diffusion.
1. DALL-E
ChatGPT'nin de yaratıcısı olan OpenAI firmasının geliştirdiği DALL-E, ilk olarak 2021'de kullanıma açılarak büyük ses getirmişti. Hemen ardından çok daha kullanışlı olan DALL-E 2 sürümü geldi. 3,5 milyar parametreye sahip bu yeni araç, diğer örneklere benzer şekilde yazılı komutlar giren kullanıcıya ızgara şeklinde 4 görsel veriyor.
Kullanıcı, bunlardan beğendiği birinin üzerine tıkladığında edit (düzenle), variations (çeşitlendir), share (paylaş) ve save (kaydet) seçenekleriyle karşılaşıyor. Variations seçeneğinde beğenilen görselin çeşitli versiyonlarını oluşturmak mümkün.
Adını ünlü ressam Salvador Dali'den alan DALL-E'nin sıradan kullanıcı için en zor yanlarından biri görselleri boyutlandırmak. Zira görseller sadece 1:1 çerçevede üretiliyor. Görseli genişletmek isteyenlerin "edit" seçeneğine tıklayarak manzaranın kalanını da kendisinin üretmesi gerekiyor. Öte yandan profesyonel tasarımcılar için bu, epey kullanışlı bir özellik olabilir.
Üstelik son güncellemeyle DALL-E 3'e yükseltilen araç, başarılı çizgi roman sahneleri de çizebilir hale geldi.
OpenAI’s latest image generation model, DALL-E 3, makes it SO easy to create comic books!
— Ammaar Reshi (@ammaar) September 30, 2023
Here are 4 panels for a fan-made Batman comic made in under 5 minutes.
Prompts included in the ALT.
Enjoy! pic.twitter.com/9LhZj4I0KW
2. Midjourney
Midjourney ise David Holz (Leap Motion kurucusu, NASA ve Max Planck'te araştırmacı) ve 11 tam zamanlı personel ve Apple, Github gibi kurumlarda deneyim elde etmiş danışmanlar tarafından yönetiliyor.
Discord sunucusu üzerinden işleyen aracı kullanmak için sunucuya katıldıktan sonra #newbies kanallarından birini seçmek gerekiyor. Kullanıcılar yazılı komutlarına için mutlaka "/imagine" diye başlamalı. İlk etapta, Discord'a yabancı olan birçok kullanıcıya karmaşık görünse de "–ar 3:2" gibi ek komutlar ekleyerek görsel boyutlarını belirlemek ve benzer birçok kısayol aracılığıyla çok çeşitli çıktılar elde etmek mümkün.
Midjourney de tıpkı DALL-E gibi kullanıcılara 4 görselden oluşan bir ızgara sunuyor. 2x2'lik 4'lü görüntü ızgarası oluştuktan sonra iki sıra seçenek ortaya çıkıyor. En üst sıradaki U1, U2, U3 ve U4 seçenekleriyse oluşturulan görüntüleri numaralandırmak için kullanıyor. Kullanıcı hangi görseli büyütmek ve tek başına indirmek isterse ona karşılık gelen numarayı seçiyor.
Alt satırda görünen V1, V2, V3 ve V4 de seçilen görüntünün varyasyonlarını oluşturmak için kullanılıyor.
Programda bir görüntünün kalitesi en fazla 1664x1664 seviyesine çıkarılabiliyor.
Midjoruney'de ayrıca, internetteki herhangi bir görüntüyü baz alarak üretim yapmak da mümkün. Bunun için de programa söz konusu görüntünün URL adresi veriliyor. Birçok kullanıcı bu özellikleri telif haklarını aşmak için kullandığı için özellikle çizerler söz konusu programları sert eleştiriyor.
3. Stable Diffusion
Stability AI firmasının geliştirdiği bu yazılımın en büyük farkı açık kaynak kodlu olması. Kaynak kodun telif hakkı sahibinin, yazılımı herhangi birine ve herhangi bir amaçla kullanma, inceleme, değiştirme ve dağıtma haklarını verdiği yazılımlara açık kaynak kodlu deniyor.
Diğer bir deyişle kullanıcılar, Stable Diffusion'ı kendi bilgisayarlarına kurabilir ve sistemi istedikleri gibi değiştirip geliştirebilir. Ancak kullanıcıların bu yazılımı bilgisayarlarına kurabilmeleri için kılavuzlar oluşturulsa da bu süreç, birçok sıradan kullanıcı için zor olabilir.
Diğer yandan kullanımı kolaylaştırmak geliştirilmiş, Dream Studio adında bir araç var. Dream Studio'nun kullanımı diğer iki araca göre çok daha kolay.
Bu arada üç araç için de stil komutları vermek çok önemli. Henüz Türkçe desteklemeyen ve yalnızca İngilizce komutları algılayabilen bu programlar, "cartoon style", "Van Gogh style", "photorealistic", "cyberpunk" ve "ultra-detailed" gibi ek komutlarla beklenen sonuçları verebiliyor.
Öte yandan bu programların ücretsiz kullanım limitleri sohbet botlarına kıyasla çok daha az. Örneğin Dream Studio, kullanıcılara 200 kredilik ücretsiz kullanım hakkı veriyor. Görselleri karmaşıklaştırdıkça harcanan kredi sayısı da artıyor.
Ayrıca Stability AI da dahil olmak üzere bu şirketlerin önemli bir kısmı telif davalarıyla karşı karşıya. Örneğin stok görsel firması Getty Images, kısa süre önce Stability AI'a dava açtı. Getty Images, Stability AI'ın yapay zekayı eğitmek için platformdaki milyonlarca fotoğrafı izinsiz kullandığını ileri sürüyor.
Hatta bunun ardından Getty Images'in kendisi de arşivindeki fotoğrafları kullanarak görüntü üretebilen ücretli bir yapay zeka programı başlatmayı planlıyor.
4. GAN modelleri
Yukarıda da bahsi geçtiği üzere, GAN'ların ortaya çıkışından önce yapay zekanın inandırıcı ve özgün görüntüler, videolar ve sesler oluşturabilmesi mümkün olmamıştı. Diğer yandan GAN teknolojisi, difüzyon modellerinden farklı.
İnsan beyninin öğrenme biçimini taklit eden bu sistem de gerçek yüzlerin görüntülerini içeren devasa bir veri kümesiyle eğitiliyor. Ancak sistemin temelinde en gerçekçi görüntüleri üretmek için yarışan iki derin sinir ağı var. Bu yarış sonucunda üretilen sahte yüzlere, "GAN görüntüleri" adı veriliyor. Açılımı "Generative Adversarial Networks" olan GAN, Türkçede çekişmeli üretken ağlar anlamına geliyor.
Kısa süre önce Birleşik Krallık'ta yapılan bir araştırmada, internet kullanıcılarının gerçek yüzleri ve yapay zeka üretimi GAN yüzlerini birbirinden ayırt edemediği tespit edilmişti. Üstelik aslında var olmayan bu yüzlerin daha gerçek görüldüğü anlaşılmıştı.
Bugün GAN'lar, difüzyon modelleri kadar yaygın kullanılmasa da bazı popüler araçlar mevcut. Bunlar arasında GAN Lab, HyperGAN, VeGAN's ve DiscoGAN gibi araçlar var.
5. Deepfake araçları
Türkçede "derin sahte" anlamına gelen deepfake kabaca birinin yüzünü dijital olarak başka birinin vücuduna monte edip elde ettiğiniz görüntüyü istediğiniz gibi kullanmanıza olanak tanıyan bir teknoloji. Kısacası internetten kolayca ulaşılabilen algoritmalar sayesinde A kişisinin yüzü B kişisine montajlanabiliyor.
İnternet kullanıcıları, deepfake içeriğe ilk kez 2017'de maruz kaldı. I yıl anonim bir Reddit kullanıcısı, Scarlett Johansson gibi ünlülerin deepfake'le oluşturulmuş sahte pornografik görüntülerini yayımlamıştı. O zamandan beri internet kullanıcılarının hayatında olan deepfake, intikam pornosu, kara propaganda ve dezenformasyon amaçlı kullanılarak endişe yaratıyor.
Deepfake görseller üretmek için derin öğrenme, otomatik kodlayıcılar ve GAN sistemleri eğitiliyor. Son dönemde Midjourney ve Stable Diffusion da deepfake üretiminde kullanılabiliyor.
Yaygın bilinen deepfake araçlarından Deepfakes Web, yüklenen video ve görüntüler aracılığıyla 4 saat boyunca eğitiliyor. Eğitilen modeli kullanarak istenen görüntülerdeki yüzleri değiştirmekse 30 dakika sürüyor.
MyHeritage adlı bir diğer araçsa "Derin Nostalji" özelliği aracılığıyla eski fotoğrafları hareketlendirmeye ve fotoğraftaki yüzlere şarkı söyletmeye olanak tanıyarak popülerlik kazanmıştı. Aracı kullanmak için tek yapmanız gereken bir görsel yüklemek ve canlandır seçeneğine basmak.
Ancak çoğunlukla mobil uygulamalar şeklinde eğlence amaçlı sunulan deepfake araçları da var. Bunlardan muhtemelen en popüleri Lensa AI. Kullanıcının yüzünü diğer insanların vücutlarına yerleştirmek için kullanılmasa da süper kahramanlar, animeler vb. birçok tarzda portreler oluşturabiliyor.
6. Firefly
Yazılım firması Adobe'un Midjourney ve DALL-E'ye rakip olarak ürettiği yapay zekâ modeli Firefly, şirketin diğer nöral filtre ve akıllı nesne seçme gibi yapay zekâ modellerinin aksine, görselleri manipüle etmek yerine sıfırdan görsel oluşturmaya imkan veriyor.
Kullanıcılara daha yüksek kaliteli ve keskin görseller sunabildiği aktarılan araç, bazı görsellerde çok detaylı ve başarılı sahneler oluştursa da bazı durumlarda absürt ya da fazla basit görseller ortaya koyabiliyor.
7. Görselleri hareketlendirme: Runway
New York merkezli girişim Runway'in kendi adıyla ürettiği yapay zeka tabanlı araçlar da yapay zeka sanatçıları ve tasarımcılar tarafından yaygın kullanılıyor.
If you can imagine it, you can generate it.
— Runway (@runwayml) June 7, 2023
Gen-2 is now available on web and mobile: https://t.co/KctIodJz2t pic.twitter.com/tbo1t7JGeJ
Bu araçlardan Runway Gen-1'de kullanıcılar sisteme video görüntüleri yüklüyor ve yapay zeka ürünü yeni videolar elde ediyor.
Runway Gen-2'daysa kullanıcılar tıpkı yukarıda bahsi geçen görsel üretim araçlarında olduğu gibi, hayal ettikleri videoları üretmek için yazılı biçimde araca tarif verebiliyor. Aynı zamanda görsel yükleyerek aracın onları hareketlendirmesini de isteyebiliyor.
Amaca yönelik botlar
1. Komut oluşturma araçları
Tüm bu üretken yapay zeka araçlarından elde edilen metin ve görseller, aslında kullanıcıların girdiği komutların kalitesine de bağlı. Bazı kullanıcılar görsellerin stilinden betimlemesine kadar çok daha kapsamlı komutlar hazırlayıp daha iyi sonuçlar elde ederken, her araca uygun farklı komutlar üretmek zor olabiliyor.
Bu sorunun üstesinden gelmek için de komut üreten yapay zeka araçları mevcut. Örneğin Midjoruney'de verilen komutları iyileştirmek için Better Prompt ve Prompt Folder yaygın kullanılan iki araç. Aigen Prompt ve AI Text Prompt Generator ise tüm görsel üretim araçları için komut oluşturmayı hedefliyor. Üstelik Aigen Prompt'u kullanırken logo üretmek için veya portre çizdirmek için özelleşmiş komutlar üretmek de mümkün.
Daha iyi komutlarla istenene yakın sonuç almak, sohbet botları için de geçerli. Bu amaçla oluşturulmuş komut siteleri arasında ChatGPT Prompt Oluşturucu, ChatGPT Prompt Generator ve FlowGPT gibi örnekler var.
2. Kodlama araçları: ChatGPT, Bard ve Copilot
Yapay zeka şirketlerinin gözünü diktiği bir diğer alan da kodlama. Örneğin, kısa süre önce Google Bard'ın kodlama destekler hale geleceği duyurulmuştu. Buna göre artık Bard; C++, Go, Java, Javascript, Python ve Typescript başta olmak üzere 20’den fazla programlama dili için doğrudan Google’ın ofis araçları üzerinde çalışabilecek. Ayrıca kodlama taleplerini karşılayabilecek ya da mevcut kodu debug yapabilecek.
Bu açıdan bakınca Bard, geliştiricilerin kullandığı Github platformunun geçen yıl kullanıma sunulan yazılım asistanı Copilot'a da doğrudan rakip oluyor.
Mart ayında Github, Copilot asistanını OpenAI'ın GPT-4 modeliyle entegre ederek bir çeşit sohbet botuna dönüştürmüştü. Copilot Chat adlı bu aracın amacı, "karmaşık görevleri basit istemlerle yürütmelerini" sağlayarak yazılımcılara zaman kazandırmak.
Botun temel özellikleri arasında belirli kodlama projelerine göre uyarlanmış gerçek zamanlı rehberlik, kod önerilerini ve karmaşık kodlama kavramlarını açıklayan kodlama analizi ve olası sorunları belirlemek için tasarlanan "basit sorun giderme" yer alıyor.
GitHub'ın ürün başkan yardımcısı Mario Rodriguez, "10 günlük çalışmayı bir günde tamamlıyor" diyor.
Bu arada Copilot Chat, GitHub'ın son dönemde geliştirdiği tek sistem değil. Şirket ayrıca, sesli komutları koda dönüştüren "Hey, GitHub!" adlı bir yazılım üzerinde çalışıyor.
Öte yandan ChatGPT'ye eklenen son özellikler, popüler sohbet botunun da bu alanda adını duyurmasını sağladı ve beklenti yarattı. Sohbet botunun GPT-4 yükseltmesiyle sunulan görsel yükleme özelliği, yazılım oluşturmada da işe yarıyor. Bazı kullanıcılar, geliştirmek istedikleri web sayfasını bir kağıda çizerek ChatGPT'den buna uygun kodlar yazmasını istediğinde verimli sonuçlar alıyor.
From now on I’m now going to be using AI to build software by simply drawing it. pic.twitter.com/qKovq5CJBA
— Mckay Wrigley (@mckaywrigley) September 27, 2023
3. Yaratıcı yazın: Sudowrite
Birçok sohbet botu aynı zamanda kısa öyküler üretmek için de kullanılabiliyor. Ancak yalnızca edebiyat üretimine odaklanan programlar da var. Sudowrite bu programların en popüleri.
Amit Gupta ve James Yu adlı iki araştırmacı tarafından geliştirilen programda kullanıcılar, yazdıklarını bir arayüze yapıştırıyor. Bunun ardından program, çeşitli kelimeler seçerek metni yeniden yazmaya başlıyor ya da olay örgüsünün devamı için önerilerde bulunuyor.
Sistemin arka planında OpenAI'ın GPT-3 ve GPT-4 dil modelleri var. Gupta ve Yu, 2021'de bu sistemi kısa öyküler ve roman özetleriyle eğitti. Sistemin yazarlara yardımı dokunan en önemli özelliği olay örgüsünü ilerletmek için beyin fırtınası da yapabimesi.
Özellikle ABD'de e-kitap alanında üretim yapan yazarlardan bazılarının Sudowrite veya benzer yapay zeka araçlarından yararlandığı biliniyor. Zira Rekabetin fazla olduğu e-kitap yayıncılığında okurlara düzenli olarak metin sunmak çok önemli olduğu için yazarlar işlerini hızlandırma amacıyla yapay zekadan yardım almaktan çekinmiyor.
Ben de Sudowrite ve ChatGPT kullanarak "Noel Baba Cinayeti Vakası" adlı kısa bir öykü yazmış ve Aralık 2022'de polisiye dergi 221B'de yayımlamıştım. Öykünün sonunda programları nasıl kullandığımı ayrıntılarıyla açıklamıştım.
4. Çeviri araçları: Deepl, OpenL ve MateCat atılımı
Son dönemde üretken yapay zekanın pek çok alanında olduğu gibi çeviri araçlarında da ciddi ilerlemeler kaydedildi. Google Translate halen en sık kullanılan araçların önde gelen bir örneği olsa da yapay zeka destekli diğer araçlar giderek yaygınlaşıyor.
Bunların başında Deepl geliyor. Çeviri sistemi 2016'da Jaroslaw Kutylowski liderliğindeki bir ekip tarafından Linguee bünyesinde geliştirildi. Son dönemde ciddi ilerleme kaydeden program, Türkçe de dahil 31 dili kapsıyor. Deepl'e dosya yükleyerek çeviri yapmak da mümkün olduğu gibi internet sitelerini de bütünüyle çevirebilirsiniz. Aracın ücretli Pro versiyonu da var ama bu henüz Türkiye'den kullanılamıyor.
Benzer bir araç da OpenL. Ücretsiz versiyonda her gün 20 kullanım hakkı sunan araç, görsel çevirme ve dilbilgisi düzeltme gibi ek seçenekleriyle öne çıkıyor.
Bunların yanı sıra çevirmek istediğiniz dosyaları yükleyebildiğiniz, çevrilecek metni cümle cümle bölen ve pratiklerinizden zamanla öğrenerek çeviri önerileri sunan programlar da var. Bunların başında MateCat ve SmartCat geliyor. Diğer yandan MateCat, 17 Mayıs'ta OpenAI'ın GPT-4 dil modeliyle entegrasyonunu duyurmuştu. Bu da çeviri programının, benzerleri arasından büyük ölçüde sıyrılmasını sağlıyor.
5. Flört botları: Replica AI
Yapay zekalı sanal arkadaş uygulaması Replika, aslında hayatımıza ChatGPT'den önce girdi. Ancak Replika da yalnızca eğlence amaçlı bir sistem. Bu uygulamayı kendi ürettiğiniz bir karakterle arkadaşlık veya romantik sohbetler etmek için kullanıyorsunuz.
Hatta bazı kullanıcılar Replika'yı cinsel içerikli sohbetler için de kullanıyor. Örneğin şirket kısa süre önce, erotik etkileşimleri uygulamalarından kaldırma kararı almış ve daha sonra geri adım atmak zorunda kalmıştı. ABD merkezli şirket, kullanıcılardan gelen tepkilerin ardından erotik etkileşimleri sohbet botlarına tekrar getirmişti.
Bunun yanı sıra Replika'da ürettiğiniz sanal karakter, sizinle konuştukça hayatınız hakkında bilgi sahibi oluyor. Karakterin hafızasını manuel olarak da değiştirebiliyorsunuz. Örneğin istemediğiniz bir bilgiyi hafızadan silebiliyor veya yeni şeyler ekleyebiliyorsunuz.
Replika bu şekilde, sanal karakterlerin kullanıcılara daha kişisel bir deneyim sunmasını amaçlıyor.
Mobil uygulamaları daha fazla rağbet görse de sistemi web sitesinden kullanmak da mümkün. Ancak mobilde artırılmış gerçeklik özelliklerinden yararlanabiliyorsunuz. Örneğin ürettiğiniz karakteri salonunuzun ortasındaymış gibi görüntüleyebilirsiniz.
Replica AI'ın alternatifleri arasında ise Kajiwoto, Romantic AI ve Nomi gibi araçlar var.
6. Ünlülerle sohbet: Character AI
Bu ilginç platformda karşınızda Kraliçe II. Elizabeth, Taylor Swift, Elon Musk, Albert Einstein ve hatta Mustafa Kemal Atatürk varmış gibi mesajlaşabiliyorsunuz.
İlk kez Eylül 2022'de hizmet vermeye başlayan Character.AI, geçmişte Google bünyesinde çalışmalarını sürdüren Daniel De Freitas ve Noam Shazeer tarafından kuruldu. Bloomberg'ün aktarımına göre şimdiye dek 5 milyon kadar kullanıcısı oldu.
Mobil uygulama desteğine de sahip olan programın beta sürümüne web sitesinden de erişmek mümkün.
7. Dark Web araçları
Tüm bu yapay zeka araçlarının dark web'de geliştirilen versiyonları da var. Bunlar genellikle "ChatGPT'nin kötü ikizleri" diye anılıyor. Son günlerde adından en çok söz ettiren örnekse WormGPT. Siber güvenlik firması SlashNext, WormGPT'nin dark web'deki siber suç forumlarında pazarlandığını tepit etti. Firma, bu yapay zeka aracını bilgisayar korsanlığı faaliyetlerinde kullanılabilecek, insan elinden çıkmışa benzeyen metinler üretebilen "sofistike bir yapay zeka modeli" diye tanımlıyor.
Netenrich araştırmacıları da dark web'de abonelik esasıyla satılan ve Telegram'da reklamları dolaşan FraudGPT adlı bir hacker aracını keşfetti. Şimdiye dek 3 binden fazla aboneye sahip olduğu iddia edilen araç, bilgisayar korsanlarının işlerini yapay zekanın yardımıyla yürütmeleri için geliştirilmiş.
ChatGPT'yi "yapay zekanın tipik sınırlarından kurtulan ve kendileri için belirlenen kurallara uymak zorunda olmayan" DAN adında kurgusal bir karaktere dönüştüren bir grup da mevcut. İstihbarat stratejisti Anthony Mussario, DAN'dan kurgusal bir finansal hizmetler firması için bir kimlik avı e-postası hazırlamasını istediğini ve aracın da bunu yaptığını söylüyor.
Diğer yandan dark web tabanlı yapay zeka araçlarının mutlaka kötü amaçlar doğrultusunda geliştirilmiş olması da gerekmiyor. Örneğin Güney Koreli araştırmacılar, Tor ağını kullanarak dark web'den elde ettikleri tüm verilerle DarkBERT adlı bir sohbet botu oluşturdu. Bu aracın, kolluk kuvvetlerinin ve araştırmacıların dark web'i bir bütün olarak daha iyi anlamasını sağlamak için kullanılıyor.
8. Ses klonlama araçları
Son günlerde Instagram videoları arasında gezinen kullanıcılar, İbrahim Tatlıses ve Yıldız Tilbe'nin ya da Doğu Perinçek ve Ertuğrul Kürkçü'nün geçmişteki meşhur tartışmalarının İngilizce versiyonlarına tanık oluyor. Siyasilerin çeşitli türküleri seslendirdiği videolar da epey popüler. Söz konusu videoların ardındaysa ünlü şahsiyetlerin seslerini klonlayan yapay zeka araçları var.
Bunların önde gelen örneklerinden biri ElevenLabs firmasının geliştirdiği Voice Lab. Şubat ayında VICE muhabiri Joseph Cox, bu uygulamayı kullanarak kendi sesini kopyalamıştı. Daha sonra bankasını arayan Cox, telesekretere yapay zeka üretimi ses dosyasını dinletmiş, böylece sesli imza uygulamasını kandırmayı ve hesaplarına erişmeyi başarmıştı.
Bu uygulamalar genellikle kopyalanması istenen sesin birkaç dakikalık kaydının yüklenmesiyle çalışıyor. Bu araçlar önceki daha basit örneklerin aksine gerçekçi ses dosyaları üretmeleriyle öne çıkıyor. Örneğin Murf adlı bir diğer araç, öfke ve mutluluktan üzüntüye ve daha fazlasına kadar çeşitli insan duygularını taklit ederek ses klonluyor. Resemble AI ise kopyalanacak sesin vurgularını ve noktalama işaretlerini tanımlayabilecek şekilde tasarlanmış.
Diğer yandan çok daha kısa sürede ses klonladığı iddia edilen araçlar da var. Örneğin Coqui tarafından geliştirilen XTTS yapay zeka modelinin sadece üç saniyelik ses dosyası aracılığıyla üretim yapabildiği belirtiliyor.
Söz konusu teknoloji, kısa süre önce Spotify'ın artık podcastleri sunucuların kendi sesleriyle istenen dillere çevireceğini duyurmasıyla yeniden gündeme geldi. Yani artık Spotify kullanıcıları, İngilizce podcastleri konuşmacıların kendi sesleriyle Türkçe dublajlı dinleyebilecek.
9. Müzik üretim araçları
Drake ve The Weeknd'in seslerini ürkütücü bir isabetlilikle taklit eden yapay zeka ürünü şarkının, Grammy değerlendirmesine sunulması müzik ve yapay zeka ilişkisini de yeniden gündeme getirdi.
This song is VIRAL on all platforms right now.
— Mitchell Cohen (@MitchellLandon) April 16, 2023
But I think it's all a genius marketing stunt...
Not by Drake, but by a SaaS startup.
Here's a 30-second summary of the ai Drake song and my prediction of who's behind it. pic.twitter.com/puklgqjElZ
Yapay zekayla müzik üretimi aslında epey yaygın. Öyle ki popüler araçlardan biri olan Mubert, 2017'de kurulmasından bu yana 100 milyonun üzerinde parça üretti.
2019'da faaliyete geçen Boomy adlı bir diğer aracın da 16 milyondan fazla parça üretmek için kullanıldığı biliniyor.
Popüler müzik araçları arasında bir de Soundful yer alıyor. Bu araç da video ve podcast'ler için telifsiz arka plan müziği oluşturmak üzere tasarlandı. Araç, müzik üretimi için farklı türlerde 50'den fazla şablon sunuyor.
Yararlanılan kaynaklar: The Conversation, Geek Culture, Guardian, All Things.how, Analytics Insight, Tech Target, The Verge, Translated, Geekflare, Tom's Guide, Elegant Themes, Musically, Webtekno, Coin Telegraph, Shift Delete
© The Independentturkish