
بقلم: سارة | محررة نماذج الذكاء الاصطناعي · صوت تحريري بإشراف بشري
كشفت جوجل خلال مؤتمر I/O للمطورين عن نقلة نوعية في التفاعل مع تطبيقات Workspace من خلال دمج الأوامر الصوتية المدعومة بـ Gemini في Docs وKeep وGmail. هذا التطور يمثل استجابة مباشرة لنمو استخدام الاستفسارات الطويلة والمعقدة في عصر الذكاء الاصطناعي.
في Docs، تتجاوز الميزة الجديدة حدود الإملاء التقليدي إلى مستوى الذكاء السياقي. يمكن للمستخدم الآن استخراج تفاصيل السيرة الذاتية من Drive، وإضافة معلومات الأحداث من إيميل، وحتى تضمين نوادر مرحة – كل ذلك في أمر صوتي واحد متدفق. الميزة تفهم التغييرات في منتصف الجملة وتنفذ التعديلات المطلوبة دون الحاجة لإعادة البدء.

هذا النهج يحل مشكلة حقيقية: الكتابة التقليدية تجبر المستخدمين على جمل قصيرة ومتابعات متعددة تستنزف الوقت. (وفقاً لـ TechCrunch) الصوت يتيح جملاً طويلة ومهام متعددة في طلب واحد، مما يُحاكي التفكير الطبيعي أكثر من القيود التقنية للكتابة.
Keep يحصل على تطوير مشابه بقدرات أكثر تطوراً. بدلاً من مجرد تسجيل الصوت، التطبيق سيحول “تفريغ الأفكار” الصوتي إلى ملاحظات منظمة وقوائم مهيكلة باستخدام الذكاء الاصطناعي. هذا يضع جوجل في منافسة مباشرة مع تطبيقات متخصصة مثل Voicenotes وAudioPen التي رادت هذا المجال منذ سنوات.

المنافسة في مجال الإملاء الذكي تشتد بسرعة. تطبيقات مثل Wispr Flow وMonologue وAqua طورت حلولاً متقدمة، وجوجل ردت بإطلاق منتجها Rambler المدمج في Gboard في وقت سابق هذا الشهر.
Gmail يحصل على معاملة خاصة مع إمكانية محادثة Gemini مباشرة للبحث عن تفاصيل محددة كمواعيد الرحلات وأكواد حجز Airbnb ومواعيد الأطباء. هذا يحول البريد الإلكتروني من مستودع نصوص إلى مساعد شخصي يفهم السياق.
التوقيت ليس مصادفة. الرئيس التنفيذي سوندار بيشاي يشير إلى مستقبل يعتمد بالكامل على الصوت لإنشاء وتحرير المستندات (وفقاً لـ TechCrunch)، مما يعكس إدراك جوجل أن المستخدمين يعتادون على الاستفسارات الطويلة والمعقدة في عصر الذكاء الاصطناعي.
الجيل الحالي من نماذج الذكاء الاصطناعي وصل لمستوى كافٍ من الفهم ليتعامل مع تغيير الرأي في منتصف الجملة، مما يجعل الصوت طريقة إدخال أكثر طبيعية من الكتابة المجزأة. جوجل تستغل هذا التطور لتعيد تعريف الإنتاجية المكتبية.







