Seyahat sigortası şirketi InsureMyTrip araştırmacıları, ChatGPT, Gemini ve AI Mode olmak üzere üç büyük dil modelini test etti. Çalışmada, en az 60 yaşında iki kişinin de yer aldığı dört yetişkin için İsviçre’ye yedi günlük lüks bir seyahat planı oluşturuldu. Yapay zeka araçları; doğruluk, tempo, fiyatların gerçekçiliği, kaynak kullanımı ve toplam seyahat süresi gibi kriterlere göre değerlendirildi.
İlk bakışta kusursuz ama detayda hatalı
InsureMyTrip Pazarlama Direktörü Sara Boisvert, analiz sonuçlarının ilk bakışta olumlu göründüğünü ancak detaylara inildikçe sorunların ortaya çıktığını belirtti. Boisvert, “Bu planlar iyi yapılandırılmış bir program sunabiliyor. Ancak daha yakından incelendiğinde hatalar ortaya çıkıyor. Örneğin bazı restoran önerileri gerçekte mevcut değil, önemli deneyimlerin fiyatları olduğundan düşük gösteriliyor ve bazı programlar yaşlı gezginler için fiziksel olarak oldukça zorlayıcı” dedi.
Araştırmacılar, yapay zeka tarafından oluşturulan seyahat planlarının, eksik veya hatalı bilgilere rağmen oldukça güvenilir bir izlenim verdiğini vurguladı. Boisvert, “Planlar yüzeyde kusursuz ve mantıklı görünüyor. Ancak detaylı incelemede hem küçük hem de büyük hatalarla sıkça karşılaşılıyor” ifadelerini kullandı.
Hatalı fiyatlar ve gerçek olmayan mekanlar
Çalışmaya göre bazı yapay zeka önerileri seyahati ciddi şekilde olumsuz etkileyebilecek nitelikte. Aşırı uzun seyahat süreleri, yaşlı yolcular için uygun olmayan rotalar ve yanlış fiyat bilgileri dikkat çekti. Ayrıca restoranların açılış saatleri hatalı verilirken, Michelin yıldızları gibi bilgiler de yanlış yansıtıldı.
Araştırmacılar, İsviçre’nin test için ideal bir ülke olduğunu belirtti. Ülke, son 30 yılın en yüksek ABD’li ziyaretçi sayısına ulaşırken; gölleri, Alp zirveleri ve gelişmiş demiryolu ağıyla hem cazip bir destinasyon hem de planlama açısından karmaşık bir yapı sunuyor.
ChatGPT lüks rota sundu ama eksikler var
Çalışmada ChatGPT’nin, lüks odaklı ve ana destinasyonlar arasında mantıklı bir rota sunduğu ifade edildi. Ancak bazı önerilerin hatalı veya yanıltıcı olduğu görüldü. Örneğin önerilen restoranlardan biri gerçekte mevcut değilken, Michelin derecelendirmeleri yanlış aktarıldı.
Ayrıca önemli deneyimlerin fiyatlarının ciddi şekilde düşük tahmin edildiği belirlendi. Örneğin Jungfraujoch tren yolculuğu için 129–258 İsviçre frangı aralığı belirtilirken, gerçek fiyatların 342 dolardan başladığı tespit edildi.
ChatGPT’nin sunduğu otel seçeneklerinde de müsaitlik doğrulaması yapılmadığı ve her destinasyon için yalnızca iki alternatif sunulduğu görüldü. Ayrıca diğer modellere kıyasla daha az kaynak gösterdiği belirtildi.
Gemini daha dengeli ama eksik bilgi sorunu var
Gemini ise yürüyüşe alternatif olarak tekne turları, panoramik trenler ve teleferikler gibi daha uygun seçenekler sundu. Ayrıca seyahatin temelini İsviçre Seyahat Kartı üzerine kurmayı önerdi.
Otel seçeneklerinin çoğunlukla lüks segmentte olduğu ve fiyat özetinin bütçeleme açısından genel bir çerçeve sunduğu belirtildi. Ancak bazı restoranların gerçekte bulunmadığı, belirli günlere ait bilgilerin eksik olduğu ve fiyatlandırma kaynaklarının net olmadığı görüldü.
AI Mode görsel olarak güçlü ama tutarsız
AI Mode ise panoramik trenler, ikonik oteller ve İsviçre’nin ünlü Alp manzaralarını içeren görsel açıdan etkileyici bir rota oluşturdu. Demiryolu odaklı plan, araç kullanımını azaltarak seyahat stresini düşürmeyi hedefledi.
Ancak özellikle yaşlı gezginler için sonuçlar tutarsız bulundu. Bazı zorlu rotalar için yeterli uyarı yapılmazken, uzun ve dik parkurların göz ardı edildiği tespit edildi. Ayrıca restoran önerilerinde kritik bilgilerin eksik olduğu görüldü.
Uzmanlardan kritik uyarılar
Boisvert, seyahat planı yaparken yapay zekaya tamamen güvenilmemesi gerektiğini vurgulayarak, “Restoran ve otel önerilerini doğrulamak, turistik noktalar ve ulaşım fiyatlarını tekrar kontrol etmek ve günlük programın fiziksel kapasitenize uygun olduğundan emin olmak büyük önem taşıyor” dedi.
Ayrıca ulaşım kartları, destinasyonlar arası süreler ve pasaport geçerlilik şartları gibi pratik detayların da mutlaka teyit edilmesi gerektiğini sözlerine ekledi.