वॉइस इंटरैक्शन के बारे में जानकारी

वॉइस इंटरैक्शन सर्विस एपीआई, आवाज़ से कंट्रोल करने वाले अलग-अलग ऐप्लिकेशन के लिए एक एब्स्ट्रैक्शन उपलब्ध कराता है. ऐप्लिकेशन डेवलपमेंट में बताए गए दिशा-निर्देशों का पालन करके, लागू करने की सुविधाएं बनाई जा सकती हैं. इंटिग्रेशन गाइड में, इन ऐप्लिकेशन को किसी खास Android Automotive OS (AAOS) सिस्टम इमेज में इंटिग्रेट करने का तरीका बताया गया है.

शब्दावली

इस गाइड में इन शब्दों का इस्तेमाल किया गया है:

  • असिस्ट डेटा. वॉइस इंटरैक्शन सेशन शुरू होने पर, सिस्टम व्यू और स्क्रीनशॉट कैप्चर कर सकता है. साथ ही, इस जानकारी को सेशन में भेज सकता है. ऐप्लिकेशन, Activity#onProvideAssistData() और Activity#onProvideAssistContent() को लागू करके ज़्यादा जानकारी दिखा सकते हैं.
  • पुश-टू-टॉक (पीटीटी). बोलकर निर्देश देने की सुविधा का बटन, जो आम तौर पर स्टीयरिंग व्हील में होता है.
  • RecognitionService (RS). बोली पहचानने की सेवा, जिसका इस्तेमाल ऐप्लिकेशन SpeechRecognizer API के ज़रिए करते हैं. वीआईए में VoiceInteractionService और RecognitionService, दोनों शामिल होने चाहिए.
  • टैप-टू-टॉक (टीटीटी). सॉफ़्टवेयर वॉइस कंट्रोल बटन, आम तौर पर इसे सिस्टम यूज़र इंटरफ़ेस (यूआई) में शामिल किया जाता है). Android में इसे ऐसिस्ट जेस्चर भी कहा जाता है.
  • VoiceInteractionService. VIA डेवलपर की ओर से लागू की गई लाइटवाइट सिस्टम सेवा. चुनी गई सेवा, बूट होने पर सिस्टम सेवा से बंधी होती है और हमेशा चलती रहती है.
  • VoiceInteractionSession (VIS). यह क्लास, उपयोगकर्ता इंटरैक्शन के कारोबारी लॉजिक को शामिल करती है. यह उपयोगकर्ता को वॉइस इंटरैक्शन की स्थिति दिखाने, VoiceInteractor के अनुरोधों को मैनेज करने, और सहायता और स्क्रीनशॉट का डेटा पाने के लिए ज़िम्मेदार है.
  • VoiceInteractionSessionService (VSS). यह सेवा, VIA का हिस्सा है. इसकी ज़िम्मेदारी वॉइस इंटरैक्शन सेशन को मैनेज करना है. उपयोगकर्ता के साथ वॉइस इंटरैक्शन के दौरान, यह सेवा Android की सिस्टम सेवा से जुड़ी होती है. इस सेशन का सारा बिज़नेस लॉजिक, VoiceSession क्लास में लागू किया गया है. यह सेवा सिर्फ़ एक उपयोगकर्ता के वॉइस सेशन के दौरान चालू रहती है.
  • वॉइस इंटरैक्शन ऐप्लिकेशन (वीआईए). Android ऐप्लिकेशन, जिसे आवाज़ से कंट्रोल करने के लिए डिज़ाइन किया गया है. इसे असिस्टेंट कहा जाता है. इन ऐप्लिकेशन की पहचान करने के लिए, उनके मेनिफ़ेस्ट में VoiceInteractionService शामिल करें. सिस्टम में एक बार में, इनमें से सिर्फ़ एक ऐप्लिकेशन को डिफ़ॉल्ट के तौर पर चुना जा सकता है. सिर्फ़ डिफ़ॉल्ट ऐप्लिकेशन चालू रहेगा (सिस्टम सेवा से बंधा रहेगा). साथ ही, पुश-टू-टॉक (पीटीटी) या टैप-टू-टॉक (टीटीटी) इवेंट को रिसीव करेगा.

ज़िम्मेदारियां

इस टेबल में, हर पक्ष की ज़िम्मेदारियों के बारे में बताया गया है.

कार बनाने वाली कंपनियां (ओईएम) AOSP ऐप्लिकेशन डेवलपर
  • AAOS की मदद से, सूचना और मनोरंजन की सुविधा देने वाला ऐसा डिवाइस बनाएं जो काम करता हो.
  • ऑडियो इनपुट और आउटपुट लागू करें. इसके अलावा, डीएसपी के लिए, बोले गए शब्द का पता लगाने की सुविधा भी शामिल की जा सकती है.
  • बोलकर फ़ोन इस्तेमाल करने की सुविधा देने वाली सेवाओं के लिए, सिस्टम की खास अनुमतियां दें.
  • ऐप्लिकेशन की सेटिंग स्क्रीन को ऐक्सेस करने के लिए, VoiceInteractionService की ज़रूरी शर्तों का पालन करें.
  • VoiceInteractionService और उससे जुड़े एपीआई तय करें और उन्हें बेहतर बनाएं.
  • VIA डेवलपर को एपीआई दस्तावेज़, सैंपल कोड, और सहायता से जुड़ा अन्य कॉन्टेंट उपलब्ध कराएं.
  • ज़रूरी शर्तों और सुझावों के साथ UX से जुड़े दिशा-निर्देश दें.
  • VoiceInteractionService एपीआई, RecognitionService एपीआई, और NotificationListenerService एपीआई लागू करें. ज़्यादा जानकारी के लिए, ऐप्लिकेशन डेवलपमेंट पर जाएं.
  • पसंद के मुताबिक बनाया जा सकने वाला यूज़र इंटरफ़ेस (यूआई) उपलब्ध कराएं. OEM, हर कार के डिज़ाइन सिस्टम के हिसाब से इस यूआई में बदलाव कर सकते हैं.

यूज़र एक्सपीरियंस से जुड़ी ज़रूरी शर्तें

ग्राहकों को अच्छा उपयोगकर्ता अनुभव देने की ज़िम्मेदारी, OEM की होती है. OEM को यह पक्का करना होगा कि पहले से इंस्टॉल की गई सभी वॉइस इंटरैक्शन सेवाएं, पहले से इंस्टॉल की गई Assistant: यूज़र एक्सपीरियंस से जुड़े दिशा-निर्देश में बताई गई ज़रूरी शर्तों को पूरा करती हों.

Assistant का मुख्य अनुभव

वाहन में बोलकर निर्देश देने की सुविधा देने वाला ऐप्लिकेशन (वीआईए), ये काम करता है:

  • [ज़रूरी है] सिस्टम से मैनेज किए जाने वाले वॉइस इंटरैक्शन ट्रिगर (पीटीटी, टीटीटी) का जवाब देना.
  • [ज़रूरी है] लोगों को उनकी प्रोग्रेस का विज़ुअल दिखाएं. उदाहरण के लिए, सुनना, प्रोसेस करना, और पूरा करना.
  • [ज़रूरी है] उपयोगकर्ता के अनुरोधों को समझने और उन्हें पूरा करने के बारे में बताने के लिए, बोलकर या आवाज़ों का इस्तेमाल करें.
  • [ज़रूरी है] अन्य ऐप्लिकेशन के लिए, बोली को पहचानने वाले टूल के तौर पर काम करना चाहिए. SpeechRecognizer API देखें.
  • [SHOULD] हॉटवर्ड ट्रिगर होने पर जवाब देना.
  • [MAY] सेटिंग गतिविधि दिखाएं, जहां उपयोगकर्ता इस वीआईए को कॉन्फ़िगर कर सकें. उदाहरण के लिए, अनुमतियां, हॉटवर्ड कॉन्फ़िगरेशन, और साइन इन.
  • [MAY] सहायता डेटा मैनेज करना (Intent#ACTION_ASSIST)
  • [MAY] कीगार्ड (लॉक स्क्रीन) से वॉइस इंटरैक्शन की सुविधा जोड़ी गई.

Components

वॉइस इंटरैक्शन ऐप्लिकेशन, इन एजेंट के साथ इंटरैक्ट करता है:

वॉइस इंटरैक्शन के लिए आवाज़ देने वाले आर्टिस्ट

पहली इमेज. वॉइस इंटरैक्शन के लिए आवाज़ देने वाले आर्टिस्ट

जानकारी:

  • VoiceInteractionManagerService. यह सिस्टम सेवा, डिफ़ॉल्ट VIA को मैनेज करने और बाकी सिस्टम के लिए इसकी सुविधाओं को उपलब्ध कराने के लिए ज़िम्मेदार है.
  • RecognitionService. यह सेवा, सिस्टम में मौजूद अन्य ऐप्लिकेशन के लिए, बोली पहचानने की सुविधाओं को उपलब्ध कराती है.
  • SoundTrigger. यह हॉटवर्ड मैनेजमेंट लागू करता है और यह AlwaysOnHotwordDetector के ज़रिए, VIAs के लिए उपलब्ध है.
  • MediaRecorder. यह हॉटवर्ड का पता लगाने (सीपीयू का इस्तेमाल करते समय) और बोली की पहचान करने, दोनों के लिए ऑडियो इनपुट का ऐक्सेस देता है.
  • PhoneWindowManager/CarInputService. इन सेवाओं की ज़िम्मेदारी, मुख्य इवेंट को मैनेज करने के साथ-साथ VoiceInteractionManagerService की मदद से, पीटीटी को वीआईए पर भेजने की होती है.
  • User. उपयोगकर्ता, ट्रिगर (पीटीटी, टीटीटी, हॉटवर्ड) या वॉइस प्लेट यूज़र इंटरफ़ेस (यूआई) की मदद से, किसी वीआईए से इंटरैक्ट करता है.
  • CarService, Notifications, Media, Telephony, ContactsProvider वगैरह. उपयोगकर्ता के निर्देशों को पूरा करने के लिए, VoiceInteractionSession की मदद से इस्तेमाल की जाने वाली सेवाएं और ऐप्लिकेशन.

वाहन से जुड़े कॉन्सेप्ट

AAOS, Android से इन मामलों में अलग है:

  • Assistant की सामान्य सुविधाओं के अलावा, AAOS VIAs वाहन के फ़ंक्शन कंट्रोल कर सकते हैं. जैसे, एचवीएसी, सीटें, और अंदर की लाइटें. इन सुविधाओं को CarPropertyManager API का इस्तेमाल करके इंटिग्रेट किया जा सकता है. ज़्यादा जानकारी के लिए, वाहन की प्रॉपर्टी पढ़ें पर जाएं. हालांकि, इसके लिए ज़रूरी है कि OEM, ऐक्सेस को सही तरीके से कॉन्फ़िगर करें. इस बारे में खास अनुमति की अनुमति वाली सूची में बताया गया है.
  • किसी भी दूसरे फ़ॉर्म फ़ैक्टर की तुलना में, वाहन संबंधित ऐप्लिकेशन में पसंद के मुताबिक बनाने और एक जैसा अनुभव देने की सुविधा ज़्यादा काम की होती है. इन दिशा-निर्देशों को लागू करने के बारे में ज़्यादा जानने के लिए, पसंद के मुताबिक बनाने की सुविधा देखें.