Şimdi Ara

Google Gemini vs ChatGPT: Bard neden devrimsel bir teknoloji?

Sıcak Fırsatlarda Tıklananlar

Editörün Seçtiği Fırsatlar

Daha Fazla

Bu Konudaki Kullanıcılar: Daha Az

2 Misafir - 2 Masaüstü

5 sn

11
Cevap

1
Favori

1.753
Tıklama

Daha Fazla
İstatistik

Konu İstatistikleri Yükleniyor

Konuya Özel

15 oy

Öne Çıkar

Cevapla

Sayfa: 1

Giriş

Mesaj

Metin Yasir Akpınar

Haber Editörü

5255 Mesaj

Tüm Başarılarını Gör

ANASAYFA GÖRÜNÜMÜNE GEÇ

Google Gemini vs ChatGPT: Bard neden devrimsel bir teknoloji? — Geçtiğimiz saatler içerisinde Google ve Google DeepMind merakla beklenen yapay zeka modeli **Gemini'**yi duyurdu. Ne kadar iyi çalıştığına dair hala çok fazla uygulamalı geri bildirim yok ancak yazılım devinin gösterdikleri açıkçası çılgınca. Dev teknoloji şirketleri son yıllarda, özellikle de ChatGPT’nin hayatımıza girmesiyle inanılmaz bir yapay zeka yarışına soyunmuş durumda. Şimdiye kadar ChatGPT geliştiricisi OpenAI ve yatırımcısı Microsoft’un önde olduğunu gördük. Ancak Google, Gemini AI ile gizlediği elini nihayet gösterdi.

Bu makale, şu ana kadar edindiğimiz bilgilere ve okuduklarımdan edindiğim ilk izlenimlere genel bir bakış sunabilmek için hazırlandı. Gemini'nin neler yapabildiğini ve yapay zekanın geleceği için ne anlama geldiğini aktarmaya çalışacağız. Sıkı tutunun başlıyoruz.

Google Gemini nedir?

Öncelikle biraz basitten başlayalım. Gemini, Google'ın sadece metinleri değil aynı zamanda görüntüleri, videoları ve sesleri de anlayabilen yeni ve en güçlü yapay zeka modeli konumunda. Çok modlu (multimodal) bir model olan Gemini'nin matematik, fizik ve diğer alanlardaki karmaşık görevleri tamamlayabildiği ve çeşitli programlama dillerinde yüksek kaliteli kodları anlayıp üretebildiği belirtiliyor.

Şu anda Google Bard ve Google Pixel 8 entegrasyonlarıyla kullanılabiliyor ve kademeli olarak diğer Google hizmetlerine de eklenecek. Google DeepMind CEO'su ve kurucu ortağı Dennis Hassabis'e göre "Gemini, sıfırdan çok modlu olacak şekilde tasarlandı, yani metin, kod, ses, görüntü ve video dahil olmak üzere farklı bilgi türlerini genelleştirebilir ve sorunsuz bir şekilde anlayabilir, bunlar arasında çalışabilir ve birleştirebilir."

Gemini'nin 3 farklı sürümü var

Gemini Nano: Bu model daha çok cihazları hedefleyen bir mode. Google, Ultra ve Pro'nun parametre sayısını açıklamadı, ancak Nano'nun düşük ve yüksek bellekli cihazlar için Nano 1 (1.8B) ve Nano 2 (3.25B) olmak üzere iki katmana ayrıldığını biliyoruz. Bu versiyonlar cihaz üzerinde sohbet, metin özetleme ve görsel oluşturma gibi işlevleri yerine getirecek. Gemini Nano, Google'ın yapay zeka ile geliştirilmiş bir akıllı telefon haline gelecek olan Pixel 8 Pro'da yerleşik olarak bulunuyor. Bu, açıkçası süper mobil asistanların başlangıcı diyebiliriz. Gemini ayrıca Arama, Reklamlar, Chrome ve Duet AI gibi daha fazla ürün ve hizmetimizde mevcut olacak ancak ne boyutta veya ne zaman olacağını belirtmiyor.

Tüm modellerin 32K bağlam penceresi bulunuyor ki bu da en büyükleri olan Claude 2 (200K) ve GPT-4 Turbo'dan (128K) oldukça küçük. Ancak hangi boyuttaki bağlam penceresinin en uygun olduğunu söylemek zordur (tabii ki göreve bağlıdır) çünkü boyutun çok büyük olması durumunda modellerin bağlam bilgisinin büyük bir kısmını unutma eğiliminde olduğu biliniyor.

Açıkçası Google Gemini hakkında teknik bilgilerimiz ve işleyiş şekli hakkında çok fazla bir şey bilmiyoruz zira Google bunları paylaşmıyor. Bunu söylemek oldukça komik ama daha fazlasını öğrenmek için Meta'nın bir sonraki modelini yayınlamasını beklememiz gerekecek. Açık kaynaklı bir Llama 3 - eğer GPT-4 ve Gemini ile karşılaştırılabilirse - bu modellerin nasıl oluşturulduğuna ve ne üzerinde eğitildiklerine biraz ışık tutabilir.

Gemini vs ChatGPT 4

Gemini Ultra demişken vizörü biraz daha genişletelim.

Google, burada yayınladığı blog yazısında şu şekilde bir tanımlama yapıyor:

“Gemini Ultra, hem dünya bilgisini hem de problem çözme yeteneklerini test etmek için matematik, fizik, tarih, hukuk, tıp ve etik gibi 57 konuyu bir arada kullanan MMLU'da (devasa çok görevli dil anlama) %90,0'lık bir skorla insan uzmanlardan daha iyi performans gösteren ilk modeldir... Gemini Ultra ayrıca, kasıtlı muhakeme gerektiren farklı alanları kapsayan çok modlu görevlerden oluşan yeni MMMU ölçütünde %59,4'lük en yüksek skoru elde ediyor.”

Google Gemini neden devrimsel?

Gemini, henüz geliştirilme aşamasında olmasına rağmen, bilgisayarlarla etkileşim şeklimizi değiştirme potansiyeliyle şimdiden fark yaratıyor. Onu özel kılan şeyleri şu şekilde açıklamaya çalışalım:

Yapay zeka modellerinin çoğunun aksine, sadece metin değil, çok çeşitli bilgi kaynaklarını kavrayabilir ve bunlara yanıt verebilir. Gemini sizin dilinizi konuşabilecek kadar zekidir. Sonuç olarak, tıpkı bir insan gibi doğal ve sofistike tartışmalar yürütebilir. Ek olarak, Gemini kod üretme yeteneğine de sahip. Ayrıca Gemini'nin gelişmiş veri analizi becerileri, sağlıktan finansa kadar çeşitli sektörlerde faydalı içgörüler elde etmemize yardımcı olabilir. Google, geliştiricilerin yeni yapay zeka uygulamaları tasarlamasına olanak tanıyacak Gemini'nin daha hafif versiyonlarını üretmeyi planlıyor. Bu, geliştiriciler için bir rüyanın gerçekleşmesi anlamına geliyor.

Ayrıca Bkz.Google, yeni yapay zeka hızlandırıcısını duyurdu: Büyük dil modelinde 2.8 kat hızlı

Gemini, Google için büyük bir adım, ancak bir bütün olarak yapay zeka endüstrisi için dev bir sıçrama değil, olması da gerekmiyor. Yukarıda da dediğimiz gibi; Gemini, 32 standart performans ölçütün 30'unda GPT-4'ü geride bırakıyor ancak küçük marjlarla. Gemini’nin asıl alameti farikası yapay zekanın mevcut en iyi yeteneklerini tek bir güçlü pakette toplamak.

Gemini’yi tam olarak gösteren en güçlü örnek ise tavada pişmekte olan bir omletin pişip pişmediğinin sorulması (metin değil, konuşma yoluyla). Gemini, "Hazır değil çünkü yumurtalar hala cıvık" diye yanıt verdi. Bu bize çok basit geliyor belki ama bu zor bir süreç. Gemini, söyleneni tam olarak anlayıp omlet görüntüleri ile ilişkilendiriyor. İlişki kurulduktan sonra ise bir omletin piştiğinde nasıl görülmesi gerektiğiyle bağlantı kuruyor. Tüm bunlar tek bir temel modelde gerçekleşiyor.

Son sözler, halüsinasyonlar ve üst düzey muhakeme

Google Gemini AI gerçekten etkileyici, bunu kabul etmek gerekiyor. Ancak yapay zekanın temel sorunu halen çözülebilmiş değil: Halüsinasyonlar ve üst düzey muhakeme.

Google’ın yayınladığı 60 sayfalık teknik raporun sonuçlar kısmında şu ifadelere yer veriliyor:

“Etkileyici yeteneklerine rağmen, LLM'lerin kullanımında sınırlamalar olduğunu belirtmeliyiz. Model çıktılarının daha güvenilir ve doğrulanabilir olmasını sağlamak için LLM'ler tarafından üretilen "halüsinasyonlar" üzerinde devam eden araştırma ve geliştirmeye ihtiyaç duyulmaya devam ediyor. LLM'ler ayrıca sınav ölçütlerinde etkileyici performans göstermelerine rağmen nedensel anlama, mantıksal çıkarım ve karşı olgusal akıl yürütme gibi üst düzey akıl yürütme becerileri gerektiren görevlerde zorlanmaktadır.”

Yapay zekanın potansiyel olarak tehlikeli bir hızla geliştiğine dair artan söylentiler işleri pek de yavaşlatmıyor. OpenAI'ın ChatGPT'yi piyasaya sürerek yapay zeka teknolojisi geliştirme yarışını tetiklemesinden bir yıl sonra, Google tekrardan lider konuma yükselmek için devam adımlar arıyor.

Metin, resim ve video ile çalışabilen yeni bir yapay zeka modeli olan Gemini, arama motorunu halkın zihnine yerleştiren ve kurumsal bir dev yaratan PageRank'ten sonra Google'ın tarihindeki en önemli algoritma olabilir.

Gemini, bu üretken yapay zeka dalgasının zirvesi olabilir. Ancak büyük dil modelleri üzerine inşa edilen yapay zekanın bundan sonra nereye gideceği henüz belli değil. Bazı araştırmacılar bunun bir sonraki zirveden ziyade bir plato olabileceğine inanıyor.

CEO Pichai’ye göre ise yolun başındayız; “Bu modellere daha fazla akıl yürütmeyi öğrettikçe, daha büyük ve daha büyük atılımlar olacak. Daha derin atılımlar henüz gelmedi. Tüm bunları göz önüne aldığımda, gerçekten de daha işin başında olduğumuzu hissediyorum.”

Kaynak:https://blog.google/technology/ai/google-gemini-ai/#sundar-note
Kaynak:https://deepmind.google/technologies/gemini/#introduction
Kaynak:https://storage.googleapis.com/deepmind-media/gemini/gemini_1_report.pdf
Kaynak:https://www.zdnet.com/article/what-is-google-gemini/
Kaynak:https://www.wired.com/story/google-gemini-ai-model-chatgpt/
Kaynak:https://www.technologyreview.com/2023/12/06/1084471/google-deepminds-new-gemini-model-looks-amazing-but-could-signal-peak-ai-hype/

En Beğenilen Yanıtlar

Tüm Yanıtları Genişlet

Çorba bir yazı. Bir defa Gemini ile Bard farklı. Bard beş para etmez. Zaten o yüzden Gemini'ı geliştirdi Google. Bard'ın yerini alacak.

Devamında, Gemini devrim falan değil. Google CEO'su değilseniz yani. Gemini yeni bir şey sunmuyor. Multi modality zaten GPT4'le bayağıdır var. Ayrıca multi modality değil başka şeyler bu işi bir sonraki aşamaya taşıyacak. Zekâ yanında görme ve duyma gibi duyuların pek değeri yok. Tüm hayvanlar görüp duyabilir ama zekâ insanlara özel. Bu geçen sene başlayan asıl devrimi ileri taşıyacak olan şey de bundan daha öte bir şey.

Henüz Gemini'ın GPT4 ile rekabet edebildiğine dair bile bağımsız bir araştırma, test yok. Google'ın yaptığı testlerde bile aynı şekilde test edilmedikleri notu düşülüyor.

Bu öyle bir sektör ki şu an Google ve Meta gibi güçlü rakip firmalar bile iç çemberde değil ve neler olup bittiğini ve olabileceğini bilmiyor. Microsoft bile işin yarı yarıya içinde olmasına rağmen sadece beklemek ve destek olmakla yetinmek zorunda. LLM'lerin sınırlamaları, cevabı multi-modality'de aramak vs. bunlar zaten bireysel GitHub geliştiricilerine kadar herkesin aklına gelen şeyler ama asıl devrimi yapanlar tıpkı 1 sene öncesine kadar LLM'leri ilgi alanına bile almamış insanlar varken devrim yapanlar olduğu gibi şimdi de nelerle uğraştıklarını bile tam olarak bilmediklerimiz.

Gerçekten ilgi duyanlar World Science Festival'in 25 Kasım videosunu izlesin. Orada "buradan iş çıkmaz" denilen yerlerden nasıl devrim yapılabileceğini belki hayal edebilirsiniz. Multi modality'i devrim diye satanların masalları gerçek olsaydı 5 senede Starcraft'ta takılıp kalmaz, gerçek dünyaya geçmiş olurduk.

Yorumun Devamı

S.P.E.C.I.A.L.

Binbaşı

1385 Mesaj

Tüm Başarılarını Gör

Resurrectionn

Yarbay

2678 Mesaj

Tüm Başarılarını Gör

deniz_1903

Haber Editörü

1063 Mesaj

Tüm Başarılarını Gör

Gamer10

Yarbay

3351 Mesaj

Tüm Başarılarını Gör

Gamer10

kullanıcısına yanıt

Gamer10

Yarbay

3351 Mesaj

Tüm Başarılarını Gör

wageff W kullanıcısına yanıt

Sayfa: 1

Benzer içerikler

Ip işlemleri

Bu mesaj IP'si ile atılan mesajları ara Bu kullanıcının son IP'si ile atılan mesajları ara Bu mesaj IP'si ile kullanıcı ara Bu kullanıcının son IP'si ile kullanıcı ara

KAPAT X

%40
Kazan

%2,8
Kazan

%5
Kazan

%6,8
Kazan

%1,6
Kazan

%3,2
Kazan

%5,5
Kazan

%1,2
Kazan

%5
Kazan

%3,2
Kazan

%6,4
Kazan

%2
Kazan

Alışveriş Yaptıkça Para Kazan Harekete Geç »