انقلاب هوش مصنوعی در دستان شما: ابزارهای جدید گوگل برای توسعهدهندگان موبایل فاش شد!
در آستانه کنفرانس مهم Google I/O، گوگل از ابزارهای هوش مصنوعی جدیدی برای توسعهدهندگان پردهبرداری خواهد کرد که امکان استفاده محلی از قابلیتهای قدرتمند Gemini Nano را فراهم میکند. این پیشرفت به گوشیهای هوشمند اجازه میدهد تا بدون نیاز به سرورهای ابری، عملیات پیچیده هوش مصنوعی مانند خلاصهسازی و بازنویسی متن را انجام دهند.

رشد سریع هوش مصنوعی مولد، نحوه طراحی محصولات گوگل و سایر غولهای فناوری را به طور اساسی تغییر داده است. بیشتر ویژگیهای هوش مصنوعی که تا کنون استفاده کردهاید، روی سرورهای دور با قدرت پردازش بالا اجرا میشوند. در حالی که گوشی شما توان پردازش کمتری دارد، به نظر میرسد گوگل در حال آمادهسازی ابزارهای جدید و مهمی برای توسعهدهندگان در حوزه هوش مصنوعی موبایل است. انتظار میرود در کنفرانس Google I/O هفته آینده، گوگل مجموعهای جدید از APIها را معرفی کند که به توسعهدهندگان اجازه میدهد از قابلیتهای Gemini Nano برای هوش مصنوعی درون دستگاه استفاده کنند.
رونمایی از قابلیتهای جدید و تحول در برنامهنویسی موبایل
گوگل به آرامی مستنداتی درباره ویژگیهای جدید هوش مصنوعی برای توسعهدهندگان منتشر کرده است. به گفته وبسایت Android Authority، بهروزرسانی جدیدی برای ML Kit SDK منتشر خواهد شد که از APIهای هوش مصنوعی مولد درون دستگاه از طریق Gemini Nano پشتیبانی میکند. این ابزار بر پایه AI Core ساخته شده و مشابه SDK هوش مصنوعی Edge است، اما به یک مدل موجود متصل میشود که دارای مجموعهای از ویژگیهای از پیش تعریف شده است که پیادهسازی آن را برای توسعهدهندگان آسان میکند.
گوگل اعلام کرده است که APIهای GenAI ML Kit به اپلیکیشنها این امکان را میدهد که بدون ارسال دادهها به ابر، کارهایی نظیر خلاصهسازی، ویرایش، بازنویسی و توصیف تصویر را انجام دهند. با این حال، Gemini Nano به اندازه نسخه ابری قدرتمند نیست، بنابراین انتظار میرود محدودیتهایی وجود داشته باشد. به عنوان مثال، گوگل اشاره کرده است که خلاصهها نمیتوانند بیشتر از سه نکته داشته باشند و توصیفهای تصویری فقط به زبان انگلیسی ارائه میشوند. کیفیت خروجیها نیز ممکن است بر اساس نسخه Gemini Nano در گوشی متفاوت باشد. نسخه استاندارد (Gemini Nano XS) حدود ۱۰۰ مگابایت اندازه دارد، در حالی که Gemini Nano XXS که در Pixel 9a دیده شده است، یک چهارم اندازه آن است و فقط متنی بوده و دارای پنجره محتوای بسیار کوچکتری است.
گام مثبت برای اندروید و تسهیل پیادهسازی هوش مصنوعی محلی
این اقدام به طور کلی برای سیستمعامل اندروید مثبت است، زیرا ML Kit روی دستگاههای غیر از خط تولید Pixel گوگل نیز کار میکند. در حالی که دستگاههای Pixel به طور گسترده از Gemini Nano استفاده میکنند، چندین گوشی دیگر نیز به طور خاص برای اجرای این مدل طراحی شدهاند، از جمله OnePlus 13، Samsung Galaxy S25 و Xiaomi 15. با افزایش تعداد گوشیهایی که از مدل هوش مصنوعی گوگل پشتیبانی میکنند، توسعهدهندگان قادر خواهند بود ویژگیهای هوش مصنوعی مولد را برای این دستگاهها هدف قرار دهند.
مستندات در حال حاضر برای توسعهدهندگان در دسترس است، اما انتظار میرود گوگل در کنفرانس I/O درهای APIها را به روی علاقهمندان باز کند. این شرکت همچنین یک جلسه در I/O با عنوان "Gemini Nano در اندروید: ساخت با هوش مصنوعی مولد در دستگاه" را تأیید کرده است. توضیحات این جلسه وعده APIهای جدیدی را میدهد که قادر به "خلاصهسازی، ویرایش و بازنویسی متن، و همچنین تولید توصیفهای تصویری" خواهند بود که دقیقاً مشابه قابلیتهای جدید APIهای ML Kit است.
توسعهدهندگانی که به دنبال اضافه کردن ویژگیهای هوش مصنوعی مولد درون دستگاه به اندروید هستند، در حال حاضر در موقعیت دشواری قرار دارند. گوگل SDK هوش مصنوعی Edge را ارائه میدهد که میتواند دسترسی به سختافزار NPU برای اجرای مدلها را فراهم کند، اما این ابزارها آزمایشی بوده و در حال حاضر فقط روی سری Pixel 9 کار میکنند. همچنین این ابزارها محدود به متن هستند. هر دو شرکت Qualcomm و MediaTek APIهایی برای اجرای بارهای کاری هوش مصنوعی ارائه میدهند، اما ویژگیها و قابلیتها بسته به دستگاه متفاوت است که این امر ریسک اتکای طولانیمدت به آنها را افزایش میدهد. همچنین اجرای مدل خود نیاز به دانش عمیق از سیستمهای هوش مصنوعی مولد دارد. APIهای جدید باید پیادهسازی هوش مصنوعی محلی را به طرز قابل توجهی سریع و آسان کند.
با وجود محدودیتهای عملکردی مدل محلی، این یک بخش مهم از چگونگی کمک هوش مصنوعی به افراد است. بیشتر افراد احتمالاً تمایل ندارند تمام دادههای شخصی خود را به یک سرور دور ارسال کنند، اما مدل محلی میتواند این اطلاعات را به شیوهای امنتر پردازش کند. به عنوان مثال، ویژگی تصاویر صفحه گوگل، تمام تصاویر صفحه شما را مشاهده میکند، اما همه پردازشها روی گوشی شما انجام میشود. به طور مشابه، موتورولا در گوشی جدید Razr Ultra نوتیفیکیشنها را به صورت محلی خلاصه میکند. در حالی که مدل پایه Razr که قابلیت کمتری دارد، نوتیفیکیشنها را به سرور برای پردازش ارسال میکند.
انتشار APIهایی که به Gemini Nano متصل میشوند، میتواند به هوش مصنوعی موبایل ثبات و انسجام مورد نیاز را ببخشد. با این حال، این امر به همکاری گوگل و تولیدکنندگان اصلی تجهیزات (OEMs) در پشتیبانی از Gemini Nano بستگی دارد. برخی شرکتها ممکن است تصمیم بگیرند به مسیر خود بروند و گوشیهای زیادی وجود دارند که قدرت کافی برای اجرای هوش مصنوعی به صورت محلی را ندارند.