Google का नया AI मॉडल डॉल्फिन के साथ संवाद करने में मदद कर सकता है
Google ने DolphinGemma नामक एक नया AI मॉडल विकसित किया है जो डॉल्फिन की आवाज़ों को समझने और उनके साथ संवाद करने में मदद कर सकता है।

मानव इतिहास के अधिकांश समय में, हमारा डॉल्फिन के साथ संबंध एक तरफा बातचीत का रहा है: हम बोलते हैं, वे चीखते हैं, और हम समझने का नाटक करते हैं। लेकिन अब, Google के पास AI का उपयोग करके इस अंतर को पाटने की योजना है। जॉर्जिया टेक और वाइल्ड डॉल्फिन प्रोजेक्ट (WDP) के साथ मिलकर, Google ने DolphinGemma नामक एक नया AI मॉडल बनाया है जो डॉल्फिन की आवाज़ों को समझने और यहां तक कि उनकी चहचहाहट को उत्पन्न करने के लिए प्रशिक्षित है।
WDP 1985 से अटलांटिक स्पॉटेड डॉल्फिन के एक विशेष समूह पर डेटा एकत्र कर रहा है। बहामास-आधारित पॉड ने ऑडियो, वीडियो और व्यवहार संबंधी नोट्स की भारी मात्रा प्रदान की है, जिसमें शोधकर्ताओं ने हर चीख और बज़ को दस्तावेज़ किया है और यह समझने की कोशिश की है कि इसका क्या अर्थ है। इस ऑडियो का खजाना अब DolphinGemma में फीड किया जा रहा है, जो Google के खुले Gemma मॉडल परिवार पर आधारित है।
DolphinGemma डॉल्फिन की आवाज़ों को इनपुट के रूप में लेता है, उन्हें SoundStream जैसे ऑडियो टोकनाइज़र का उपयोग करके प्रोसेस करता है, और भविष्यवाणी करता है कि अगली आवाज़ क्या हो सकती है। इसे ऑटोकम्प्लीट की तरह समझें, लेकिन डॉल्फिन के लिए। यह मॉडल बहुत हल्का है और Google Pixel पर चल सकता है। WDP पहले से ही इस गर्मी में DolphinGemma को फील्ड में तैनात कर रहा है, जिसमें वॉटरप्रूफ रिग में Pixel 9s का उपयोग किया जा रहा है। ये मॉडल सुनेंगे, आवाज़ के पैटर्न की पहचान करेंगे, और शोधकर्ताओं को रियल टाइम में सार्थक अनुक्रमों को फ्लैग करने में मदद करेंगे।
लेकिन यहां अंतिम लक्ष्य सिर्फ निष्क्रिय सुनना नहीं है। WDP और जॉर्जिया टेक CHAT (सेटेशियन हियरिंग ऑग्मेंटेशन टेलीमेट्री) नामक एक सिस्टम पर भी काम कर रहे हैं, जो मूल रूप से मनुष्यों और डॉल्फिन के लिए एक दो-तरफा संचार प्रणाली है। CHAT शोधकर्ताओं को डॉल्फिन को पसंद आने वाली वस्तुओं, जैसे कि सीग्रास और फ्लोटिंग स्कार्फ, के लिए सिंथेटिक सीटी निर्दिष्ट करने की अनुमति देता है, और फिर यह देखने के लिए इंतजार करता है कि क्या डॉल्फिन उन आवाज़ों की नकल करते हैं। यह एक साझा भाषा का आविष्कार करने जैसा है, लेकिन फ्लैशकार्ड के बजाय अंडरवाटर माइक्रोफोन के साथ।
DolphinGemma सिर्फ डॉल्फिन की आवाज़ों का विश्लेषण नहीं करता है; यह भविष्यवाणी करने में मदद करता है कि कौन सी आवाज़ आ सकती है, जिससे तेज प्रतिक्रिया समय और सुचारू इंटरैक्शन संभव होते हैं। संक्षेप में, यह डॉल्फिन के लिए एक भविष्यवाणी कीबोर्ड की तरह है। पूरा प्रोजेक्ट अभी भी प्रारंभिक अवस्था में है, लेकिन Google इस साल के अंत में DolphinGemma को ओपन-सोर्स करने की योजना बना रहा है ताकि प्रगति को तेज किया जा सके। प्रारंभिक मॉडल अटलांटिक स्पॉटेड डॉल्फिन की आवाज़ों पर प्रशिक्षित है, लेकिन इसे सैद्धांतिक रूप से कुछ ट्यूनिंग के साथ अन्य प्रजातियों के लिए अनुकूलित किया जा सकता है। विचार अन्य शोधकर्ताओं को AI की चाबी सौंपना है ताकि वे इसे अपने स्वयं के ध्वनिक डेटासेट पर लागू कर सकें।
बेशक, यह अभी भी दर्शन या उनके पसंदीदा स्नैक्स के बारे में डॉल्फिन के साथ चैट करने से बहुत दूर है। कोई गारंटी नहीं है कि डॉल्फिन की आवाज़ें मानव-जैसी भाषा से सीधे मैप होती हैं। लेकिन DolphinGemma सार्थक पैटर्न के लिए वर्षों के ऑडियो को छानने में मदद करेगा। डॉल्फिन एकमात्र ऐसे जानवर नहीं हैं जिनके साथ मनुष्य AI का उपयोग करके संवाद कर सकते हैं। वैज्ञानिकों के एक अन्य समूह ने किसानों को उनके भावनात्मक और शारीरिक स्वास्थ्य को समझने में मदद करने के लिए सूअरों की भावनाओं को डिकोड करने के लिए एक AI एल्गोरिदम विकसित किया है। हालांकि, डॉल्फिन निर्विवाद रूप से अधिक करिश्माई हैं। कौन जानता है, शायद किसी दिन आप नौकायन करते समय एक डॉल्फिन से दिशा पूछ पाएंगे, कम से कम अगर आप अपना फोन पानी में नहीं गिराते हैं।