पब्लिश करने की तारीख: 12 दिसंबर, 2024, पिछली बार अपडेट किए जाने की तारीख: 20 मई, 2025
पहले से मौजूद एआई एपीआई की मदद से, आपका वेब ऐप्लिकेशन एआई की मदद से टास्क पूरे कर सकता है. इसके लिए, उसे अपने एआई मॉडल को डिप्लॉय या मैनेज करने की ज़रूरत नहीं होती. हम इन एपीआई को सभी ब्राउज़र के लिए एक जैसा बनाने पर काम कर रहे हैं.
ज़रूरी शर्तें
डिवाइस में पहले से मौजूद एआई का इस्तेमाल करने के लिए, मॉडल और हार्डवेयर से जुड़ी कुछ ज़रूरी शर्तें हैं.
मॉडल
Translator और Language Detector API, एक्सपर्ट मॉडल का इस्तेमाल करते हैं. अन्य सभी एपीआई, भाषा मॉडल का इस्तेमाल करते हैं. इन्हें डेस्कटॉप और लैपटॉप पर स्थानीय तौर पर चलाने के लिए डिज़ाइन किया गया है.
Summarizer API, Writer API, Rewriter API, और Proofreader API में सिर्फ़ टेक्स्ट-टू-टेक्स्ट मोड का इस्तेमाल किया जा सकता है. Prompt API में मल्टीमॉडल की सुविधाएँ उपलब्ध हैं.
Chrome में Gemini Nano
Chrome, Gemini Nano के भाषा मॉडल का इस्तेमाल करता है. Gemini Nano की सुविधा, फ़ोन या टैबलेट पर उपलब्ध नहीं है.
Chrome 140 से, Gemini Nano में इनपुट और आउटपुट टेक्स्ट के लिए अंग्रेज़ी, स्पैनिश, और जैपनीज़ भाषा का इस्तेमाल किया जा सकता है.
एआई एपीआई का इस्तेमाल करने से पहले, जनरेटिव एआई के इस्तेमाल से जुड़ी पाबंदी की Google की नीति को स्वीकार करें.
हार्डवेयर
Chrome में इन एपीआई का इस्तेमाल करके सुविधाएं चलाने वाले डेवलपर और उपयोगकर्ताओं के लिए, ये ज़रूरी शर्तें लागू होती हैं. अन्य ब्राउज़र के लिए, ऑपरेटिंग सिस्टम की ज़रूरी शर्तें अलग-अलग हो सकती हैं.
Language Detector और Translator API, डेस्कटॉप पर Chrome में काम करते हैं. ये एपीआई, फ़ोन या टैबलेट पर काम नहीं करते. Prompt API, Summarizer API, Writer API, Rewriter API, और Proofreader API, Chrome में तब काम करते हैं, जब ये शर्तें पूरी होती हैं:
- ऑपरेटिंग सिस्टम: Windows 10 या 11; macOS 13+ (Ventura और इसके बाद के वर्शन); Linux; या Chromebook Plus डिवाइसों पर ChromeOS (Platform 16389.0.0 और इसके बाद के वर्शन). Gemini Nano का इस्तेमाल करने वाले एपीआई, फ़िलहाल Android, iOS, और Chromebook Plus के अलावा अन्य डिवाइसों पर ChromeOS के साथ काम नहीं करते.
- स्टोरेज: जिस वॉल्यूम में आपकी Chrome प्रोफ़ाइल है उसमें कम से कम 22 जीबी खाली जगह होनी चाहिए.
- जीपीयू या सीपीयू: बिल्ट-इन मॉडल, जीपीयू या सीपीयू के साथ काम कर सकते हैं.
- जीपीयू: इसमें कम से कम 4 जीबी वीआरएएम होना चाहिए.
- सीपीयू: 16 जीबी या इससे ज़्यादा रैम और चार या इससे ज़्यादा सीपीयू कोर.
- नेटवर्क: अनलिमिटेड डेटा या ऐसा कनेक्शन जिस पर डेटा से जुड़ी पाबंदी न हो.
ब्राउज़र के मॉडल को अपडेट करने पर, Gemini Nano का साइज़ बदल सकता है. मौजूदा साइज़ जानने के लिए, chrome://on-device-internals पर जाएं.
बनाना शुरू करें
डेवलपमेंट के अलग-अलग चरणों में, एआई के कई एपीआई पहले से मौजूद हैं. इनमें से कुछ सुविधाएं Chrome के स्टेबल वर्शन में उपलब्ध हैं. कुछ सुविधाएं, ओरिजिन ट्रायल में हिस्सा लेने वाले लोगों के लिए उपलब्ध हैं. वहीं, कुछ सुविधाएं सिर्फ़ Early Preview Program में हिस्सा लेने वाले लोगों के लिए उपलब्ध हैं.
हर एपीआई के लिए, मॉडल को शुरू करने और डाउनलोड करने के निर्देशों का अपना सेट होता है. ये निर्देश, स्थानीय प्रोटोटाइपिंग और ओरिजिन ट्रायल के साथ प्रोडक्शन एनवायरमेंट, दोनों के लिए होते हैं.
- Translator API
- Language Detector API
- Summarizer API
- Writer API और Rewriter API
- Proofreader API
- Prompt API
इन सभी एपीआई का इस्तेमाल, Chrome एक्सटेंशन बनाने के लिए किया जा सकता है.
मॉडल डाउनलोड
Chrome में एपीआई और मॉडल पहले से मौजूद होते हैं. जब कोई उपयोगकर्ता पहली बार इन एपीआई के साथ इंटरैक्ट करता है, तो मॉडल को ब्राउज़र में डाउनलोड करना ज़रूरी होता है.
यह पता लगाने के लिए कि कोई एपीआई इस्तेमाल किया जा सकता है या नहीं, एसिंक्रोनस availability() फ़ंक्शन को कॉल करें. यह फ़ंक्शन, इनमें से किसी एक वैल्यू के साथ प्रॉमिस दिखाता है:
"unavailable": उपयोगकर्ता के डिवाइस या अनुरोध किए गए सेशन के विकल्पों के साथ काम नहीं करता. ऐसा हो सकता है कि डिवाइस में ज़रूरत के मुताबिक पावर या डिस्क स्पेस न हो."downloadable": सेशन बनाने के लिए, कुछ और फ़ाइलें डाउनलोड करनी होंगी. इनमें कोई विशेषज्ञ मॉडल, भाषा मॉडल या फ़ाइन-ट्यूनिंग शामिल हो सकती है.create()को कॉल करने के लिए, उपयोगकर्ता के खाते को चालू करना ज़रूरी हो सकता है."downloading": डाउनलोड जारी हैं. सेशन का इस्तेमाल करने से पहले, डाउनलोड पूरा होना ज़रूरी है."available": सेशन तुरंत बनाया जा सकता है.
उपलब्धता की जानकारी पाने के लिए, कुछ एपीआई को अतिरिक्त विकल्पों की ज़रूरत होती है. उदाहरण के लिए, Prompt API के लिए, भाषा की सुविधा के बारे में बताना ज़रूरी है:
// Makes sure the model is available for English and Japanese.
await LanguageModel.availability({ languages: ["en", "ja"] });
उपयोगकर्ता का खाता चालू करना
अगर डिवाइस में एआई एपीआई पहले से मौजूद हैं, लेकिन मॉडल को अब तक डाउनलोड नहीं किया गया है, तो उपयोगकर्ता को आपके पेज के साथ इंटरैक्ट करना होगा. इससे आपका ऐप्लिकेशन, create() के साथ सेशन शुरू कर पाएगा.
UserActivation.isActive प्रॉपर्टी का इस्तेमाल करके यह पुष्टि करें कि उपयोगकर्ता ने पेज लोड होने के बाद से, सीधे तौर पर पेज के साथ इंटरैक्ट किया है. इसमें टैप करना, क्लिक करना, कुंजी दबाना, mousedown या अन्य स्टिक ऐक्टिवेशन इवेंट शामिल हो सकते हैं.
// Check for user activation.
if (navigator.userActivation.isActive) {
// Create an instance of a built-in API
}
उदाहरण के लिए, Summarizer API की मदद से, उपयोगकर्ताओं से "खास जानकारी पाएं" बटन के साथ इंटरैक्ट करने के लिए कहा जा सकता है, ताकि Summarizer.create() को चालू किया जा सके. इसके अलावा, उपयोगकर्ता के टाइप करना शुरू करने के बाद, keydown इवेंट के तौर पर खास जानकारी पाने की सुविधा को चालू किया जा सकता है.
लोकल होस्ट पर एपीआई का इस्तेमाल करना
ये सभी एपीआई, Chrome में localhost पर उपलब्ध हैं.
chrome://flags/#optimization-guide-on-device-modelपर जाएं.- चालू है को चुनें.
- फिर से लॉन्च करें पर क्लिक करें या Chrome को रीस्टार्ट करें.
Gemini Nano का इस्तेमाल करने वाले एपीआई के लिए, आपको chrome://flags/#prompt-api-for-gemini-nano को चालू है या एक से ज़्यादा भाषाओं के लिए चालू है पर सेट करना होगा. DevTools Console में जाकर, यह पुष्टि की जा सकती है कि मॉडल डाउनलोड हो गया है और यह उम्मीद के मुताबिक काम कर रहा है.
कंसोल में await LanguageModel.availability(); चलाएं.
लोकलहोस्ट से जुड़ी समस्या हल करना
अगर आपको chrome://flags में फ़्लैग नहीं दिखते हैं, तो पक्का करें कि आपने Chrome का नया वर्शन डाउनलोड किया हो.
अगर मॉडल उम्मीद के मुताबिक काम नहीं करता है, तो यह तरीका अपनाएं:
- Chrome को रीस्टार्ट करें.
chrome://on-device-internalsपर जाएं.- मॉडल की स्थिति टैब चुनें और पक्का करें कि कोई गड़बड़ी न हो.
- DevTools खोलें और कंसोल में
LanguageModel.availability();टाइप करें. इससेavailableदिखना चाहिए.
अगर ज़रूरी हो, तो कुछ देर इंतज़ार करें और इन चरणों को दोहराएं.
स्टैंडर्ड प्रोसेस
हम इन एपीआई को स्टैंडर्ड बनाने पर काम कर रहे हैं, ताकि ये सभी ब्राउज़र पर काम कर सकें. इसका मतलब है कि हमने वेब प्लैटफ़ॉर्म कम्यूनिटी को एपीआई का सुझाव दिया है. साथ ही, हमने इन्हें आगे की चर्चा के लिए W3C वेब इनक्यूबेटर कम्यूनिटी ग्रुप में भेज दिया है.
हम हर एपीआई के लिए, W3C, Mozilla, और WebKit से सुझाव/राय मांग रहे हैं.
उपयोगकर्ताओं से जुड़ना और सुझाव/राय देना या शिकायत करना
अगर आपने एआई की सुविधा आज़माई है और आपको कोई सुझाव/राय देनी है या शिकायत करनी है, तो हमें बताएं.
- पहले से मौजूद सभी एआई एपीआई के बारे में जानें.
- Early Preview Program में शामिल हों. इससे आपको नए एपीआई के बारे में पहले से पता चल जाएगा. साथ ही, आपको हमारी मेलिंग लिस्ट का ऐक्सेस भी मिल जाएगा.
- अगर आपको Chrome में इस सुविधा को लागू करने के बारे में कोई सुझाव, शिकायत या राय देनी है, तो Chromium में गड़बड़ी की रिपोर्ट सबमिट करें.
- वेब स्टैंडर्ड के बारे में जानें.