Logo ar.androidermagazine.com
Logo ar.androidermagazine.com

ما هو جوجل على الوجهين؟

جدول المحتويات:

Anonim

في Google I / O 2018 ، شاهدنا عرضًا تقديميًا لأحدث شيء جديد على Google ، وهو Duplex. أظهرت الشاشة التي تبلغ 60 قدمًا على خشبة المسرح ما يبدو تمامًا مثل تطبيق مساعد Google الخاص بك مع تشغيل المساعد عبر الإنترنت لإجراء مكالمة هاتفية مع مصفف شعر وإعداد موعد ، مع استكمال الإيقاف المؤقت ، والأومياء ، والأههات ، و بقية الخصوصيات التي ترافق خطاب الإنسان. لا يبدو أن الشخص الذي يأخذ الموعد يعرف أنه يتحدث إلى جهاز كمبيوتر لأنه لا يبدو وكأنه جهاز كمبيوتر. ولا حتى قليلا.

يبدو هذا النوع من العرض مدهشًا (وربما زاحفًا قليلاً) ولكن ماذا عن التفاصيل؟ ما هو الوجهين ، بالضبط؟ كيف يعمل حتى؟ لدينا جميعًا أسئلة عندما نرى شيئًا مختلفًا ويعد العثور على إجابات منتشرة عبر الإنترنت أمرًا مؤلمًا. دعنا نتعرف على ما نعرفه حتى الآن حول Google Duplex.

ما هو جوجل دوبلكس؟

إنها أداة جديدة من Google تهدف إلى استخدام الذكاء الاصطناعي (AI) "لإنجاز المهام الواقعية عبر الهاتف" وفقًا لباحثي ومطوري الذكاء الاصطناعي من Google. يعني هذا في الوقت الحالي مهام محددة للغاية مثل تحديد المواعيد ، ولكن يتم تطوير التقنية مع التركيز على التوسع في مجالات أخرى. إنفاق المليارات لإنشاء طريقة رائعة لإجراء حجوزات العشاء يبدو وكأنه شيء ستفعله Google ، لكن ذلك لا يمثل فائدة كبيرة للوقت أو المال.

إن وحدة الطباعة على الوجهين أيضًا أكثر من التي رأيناها في العرض التوضيحي ، وإذا ما غادرت المختبر ، فستكون أكثر بكثير مما نراه أو نسمع في نهايتنا. هناك بنوك ضخمة من البيانات وأجهزة الكمبيوتر التي تقوم بمعالجتها والتي ليست باردة تقريبًا مثل النتيجة النهائية. لكنها ضرورية لأن إجراء الحديث عبر الكمبيوتر والتفكير ، في الوقت الحقيقي ، كأنه شخص صعب.

أليس هذا مثل الكلام إلى النص؟

كلا. ليس حتى قريب. وهذا هو السبب في أنها مشكلة كبيرة.

تم تصميم Duplex لتغيير الطريقة التي يتحدث بها الكمبيوتر على الهاتف.

الهدف من Duplex هو جعل الأمور تبدو طبيعية وللمساعد في التفكير أثناء الطيران للعثور على موعد يعمل بنجاح. إذا قال جو ، "نعم ، عن ذلك - ليس لدي أي شيء مفتوح حتى العاشرة ، فهل هذا جيد؟" يحتاج المساعد إلى فهم ما يقوله Joe ، ومعرفة معنى ذلك ، والتفكير فيما إذا كان ما يقدمه Joe سيعمل لك. إذا كنت مشغولاً في جميع أنحاء المدينة في الساعة 10 وسوف يستغرق الأمر 40 دقيقة للوصول إلى Joe's Garage ، يجب أن يكون المساعد قادرًا على معرفة ذلك ويقول 11:15 إنه سيكون جيدًا.

على نفس القدر من الأهمية بالنسبة إلى Google ، فإن دوبلكس يجيب ويظهر وكأنه شخص. قالت Google إنها تريد من الشخص على الهاتف ألا يعرف أنه يتحدث إلى جهاز كمبيوتر ، رغم أنه قرر في نهاية المطاف أنه من الأفضل إبلاغه. عندما نتحدث مع أشخاص ، نتحدث بشكل أسرع وأقل رسمية (اقرأ: تعثر غير متماسك من وجهة نظر جهاز كمبيوتر) من عندما نتحدث إلى المساعد على الهاتف أو الكمبيوتر في DMV عندما نتصل. يحتاج Duplex إلى فهم هذا وإعادة إنشائها عند الرد.

أخيرًا والأكثر إثارة للإعجاب هو أن على الوجهين فهم السياق. الجمعة ، الجمعة القادمة ، والجمعة بعد الأسبوع المقبل ، كلها مصطلحات أنت وأنا أفهمها. دوبلكس يحتاج إلى فهمهم ، أيضا. إذا تحدثنا بنفس الطريقة التي كتبناها ، فلن تكون هذه مشكلة ، لكننا نعلم أنك لا تبدوا أنها تبدو مزعجة للغاية نعم ، إنها ليست مثل الخلط على الرغم من أننا سمعنا ذلك طوال حياتنا وقد اعتدنا على ذلك لا ، ليس لدينا مشاكل تعرفها أو تفهمها.

سأقوم بتقديم الإسعافات الأولية إلى محرري بعد كتابة ذلك بينما تقول ذلك بصوت عالٍ ، لذلك ترى معنى ذلك.

كيف يعمل دوبلكس؟

من نهاية المستخدم ، الأمر بسيط مثل إخبار المساعد بالقيام بشيء ما. في الوقت الحالي ، كما ذكرنا ، هناك شيء ما يقتصر على تحديد المواعيد لذلك نقول ، "يا Google تجعلني موعدًا لتغيير الزيت في مرآب جو صباح الثلاثاء" ، و (بعد أن ذكرنا أن نقول من فضلك) فإنه سيتصل قم بإعداد Joe's Garage وقم بإعداد الأشياء ، ثم أضفه إلى التقويم الخاص بك.

تستخدم المحادثات المستمرة الكثير من نفس التكنولوجيا الأساسية مثل الطباعة على الوجهين.

أنيق جدا. ولكن ما يحدث خارج الكاميرا هو أكثر نفوذاً.

يستخدم Duplex ما يسمى الشبكة العصبية المتكررة. تم تصميمه باستخدام تقنية TensorFlow Extended من Google. قامت Google بتدريب الشبكة على جميع رسائل البريد الصوتي مجهولة المصدر ومحادثات Google Voice التي وافقت على السماح لها بالاستماع إليها إذا اشتركت مع مزيج من برنامج التعرف على الكلام والقدرة على النظر في تاريخ المحادثة وتفاصيل مثل وقت اليوم والموقع كلا الطرفين.

بشكل أساسي ، تقوم شبكة كاملة من أجهزة الكمبيوتر ذات الطاقة العالية بضرب البيانات في السحابة والتحدث من خلال المساعد على هاتفك أو أي منتج آخر يحتوي على مساعد على متن الطائرة.

ماذا عن الأمن والخصوصية؟

يتعلق الأمر بشيء بسيط واحد: هل تثق في Google. ذكاء الجهاز على الجهاز هو شيء حقيقي ، رغم أنه مقيد وجديد نسبيًا. قامت Google بتطوير ML Kit لمساعدة المطورين على القيام بالمزيد من هذا النوع من الأشياء على الجهاز نفسه ، ولكن الأمر كله يتعلق بالطاقة الحاسوبية. يتطلب الأمر قدرًا لا يصدق من الحسابات لإجراء موعد للشعر بهذه الطريقة ، ولا يمكن القيام بذلك على هاتفك أو Google Home.

يجب أن تثق في Google ببياناتك لاستخدام منتجاتها الذكية ولن يكون Duplex مختلفًا.

تحتاج Google إلى الاستفادة من الكثير من بياناتك الشخصية للقيام بالأشياء الخاصة التي يمكن لـ Assistant القيام بها في الوقت الحالي ، ولا يقوم Duplex بتغيير ذلك. الجديد هنا هو أنه يوجد الآن طرف آخر معني بمنح Google إذنًا صراحة للاستماع إلى محادثتهم.

إذا / عندما يصبح Duplex منتجًا استهلاكيًا فعليًا لأي شخص لاستخدامه ، فتوقع انتقاده والاعتراض عليه في المحاكم. ويجب أن يكون ؛ إن السماح لـ Google بتحديد ما هو أفضل لخصوصيتنا هو مثل القول المأثور القديم لثعالبين والدجاج الذي يقرر ما هو لتناول العشاء.

متى سيكون لدي دوبلكس على هاتفي؟

توقع بعض التغييرات الكبيرة على المساعد في وقت لاحق من هذا العام.

لا أحد يعرف الآن. قد لا يحدث أبدا. تشعر Google بالإثارة عندما تتمكن من القيام بهذا النوع من الأشياء الرائعة وتريد مشاركتها مع العالم. هذا لا يعني أنه سيكون ناجحًا أو يصبح منتجًا حقيقيًا على الإطلاق.

في الوقت الحالي ، يتم اختبار Duplex في بيئة مغلقة وخاضعة للإشراف. إذا سارت الأمور على ما يرام ، فسيتم إصدار إصدار تجريبي أولي للمستهلكين لإجراء حجوزات المطاعم وتحديد مواعيد صالون الشعر والحصول على ساعات عطلة عبر الهاتف في وقت لاحق من هذا العام باستخدام المساعد على الهواتف فقط.

أين يمكنني معرفة المزيد؟

غوغل منفتح بشكل مدهش حول التقنية التي تستخدمها لإنشاء دوبلكس. ستجد المعلومات ذات الصلة في المواقع التالية:

  • مدونة Google AI (Google)
  • العقل العميق
  • Tensorflow.org
  • مكتبة جامعة كورنيل
  • جوجل للبحوث (جوجل)
  • الكلمة الرئيسية (Google)
  • ML Kit (Google)

بالطبع ، نحن نتابع أيضًا Duplex عن كثب ، وستسمع آخر التطورات هنا بمجرد توفرها.