انقلاب هوش مصنوعی در دستان شما: ابزارهای جدید گوگل برای توسعه‌دهندگان موبایل فاش شد!

در آستانه کنفرانس مهم Google I/O، گوگل از ابزارهای هوش مصنوعی جدیدی برای توسعه‌دهندگان پرده‌برداری خواهد کرد که امکان استفاده محلی از قابلیت‌های قدرتمند Gemini Nano را فراهم می‌کند. این پیشرفت به گوشی‌های هوشمند اجازه می‌دهد تا بدون نیاز به سرورهای ابری، عملیات پیچیده هوش مصنوعی مانند خلاصه‌سازی و بازنویسی متن را انجام دهند.

رشد سریع هوش مصنوعی مولد، نحوه طراحی محصولات گوگل و سایر غول‌های فناوری را به طور اساسی تغییر داده است. بیشتر ویژگی‌های هوش مصنوعی که تا کنون استفاده کرده‌اید، روی سرورهای دور با قدرت پردازش بالا اجرا می‌شوند. در حالی که گوشی شما توان پردازش کمتری دارد، به نظر می‌رسد گوگل در حال آماده‌سازی ابزارهای جدید و مهمی برای توسعه‌دهندگان در حوزه هوش مصنوعی موبایل است. انتظار می‌رود در کنفرانس Google I/O هفته آینده، گوگل مجموعه‌ای جدید از APIها را معرفی کند که به توسعه‌دهندگان اجازه می‌دهد از قابلیت‌های Gemini Nano برای هوش مصنوعی درون دستگاه استفاده کنند.

رونمایی از قابلیت‌های جدید و تحول در برنامه‌نویسی موبایل

گوگل به آرامی مستنداتی درباره ویژگی‌های جدید هوش مصنوعی برای توسعه‌دهندگان منتشر کرده است. به گفته وب‌سایت Android Authority، به‌روزرسانی جدیدی برای ML Kit SDK منتشر خواهد شد که از APIهای هوش مصنوعی مولد درون دستگاه از طریق Gemini Nano پشتیبانی می‌کند. این ابزار بر پایه AI Core ساخته شده و مشابه SDK هوش مصنوعی Edge است، اما به یک مدل موجود متصل می‌شود که دارای مجموعه‌ای از ویژگی‌های از پیش تعریف شده است که پیاده‌سازی آن را برای توسعه‌دهندگان آسان می‌کند.

گوگل اعلام کرده است که APIهای GenAI ML Kit به اپلیکیشن‌ها این امکان را می‌دهد که بدون ارسال داده‌ها به ابر، کارهایی نظیر خلاصه‌سازی، ویرایش، بازنویسی و توصیف تصویر را انجام دهند. با این حال، Gemini Nano به اندازه نسخه ابری قدرتمند نیست، بنابراین انتظار می‌رود محدودیت‌هایی وجود داشته باشد. به عنوان مثال، گوگل اشاره کرده است که خلاصه‌ها نمی‌توانند بیشتر از سه نکته داشته باشند و توصیف‌های تصویری فقط به زبان انگلیسی ارائه می‌شوند. کیفیت خروجی‌ها نیز ممکن است بر اساس نسخه Gemini Nano در گوشی متفاوت باشد. نسخه استاندارد (Gemini Nano XS) حدود ۱۰۰ مگابایت اندازه دارد، در حالی که Gemini Nano XXS که در Pixel 9a دیده شده است، یک چهارم اندازه آن است و فقط متنی بوده و دارای پنجره محتوای بسیار کوچکتری است.

گام مثبت برای اندروید و تسهیل پیاده‌سازی هوش مصنوعی محلی

این اقدام به طور کلی برای سیستم‌عامل اندروید مثبت است، زیرا ML Kit روی دستگاه‌های غیر از خط تولید Pixel گوگل نیز کار می‌کند. در حالی که دستگاه‌های Pixel به طور گسترده از Gemini Nano استفاده می‌کنند، چندین گوشی دیگر نیز به طور خاص برای اجرای این مدل طراحی شده‌اند، از جمله OnePlus 13، Samsung Galaxy S25 و Xiaomi 15. با افزایش تعداد گوشی‌هایی که از مدل هوش مصنوعی گوگل پشتیبانی می‌کنند، توسعه‌دهندگان قادر خواهند بود ویژگی‌های هوش مصنوعی مولد را برای این دستگاه‌ها هدف قرار دهند.

مستندات در حال حاضر برای توسعه‌دهندگان در دسترس است، اما انتظار می‌رود گوگل در کنفرانس I/O درهای APIها را به روی علاقه‌مندان باز کند. این شرکت همچنین یک جلسه در I/O با عنوان "Gemini Nano در اندروید: ساخت با هوش مصنوعی مولد در دستگاه" را تأیید کرده است. توضیحات این جلسه وعده APIهای جدیدی را می‌دهد که قادر به "خلاصه‌سازی، ویرایش و بازنویسی متن، و همچنین تولید توصیف‌های تصویری" خواهند بود که دقیقاً مشابه قابلیت‌های جدید APIهای ML Kit است.

توسعه‌دهندگانی که به دنبال اضافه کردن ویژگی‌های هوش مصنوعی مولد درون دستگاه به اندروید هستند، در حال حاضر در موقعیت دشواری قرار دارند. گوگل SDK هوش مصنوعی Edge را ارائه می‌دهد که می‌تواند دسترسی به سخت‌افزار NPU برای اجرای مدل‌ها را فراهم کند، اما این ابزارها آزمایشی بوده و در حال حاضر فقط روی سری Pixel 9 کار می‌کنند. همچنین این ابزارها محدود به متن هستند. هر دو شرکت Qualcomm و MediaTek APIهایی برای اجرای بارهای کاری هوش مصنوعی ارائه می‌دهند، اما ویژگی‌ها و قابلیت‌ها بسته به دستگاه متفاوت است که این امر ریسک اتکای طولانی‌مدت به آن‌ها را افزایش می‌دهد. همچنین اجرای مدل خود نیاز به دانش عمیق از سیستم‌های هوش مصنوعی مولد دارد. APIهای جدید باید پیاده‌سازی هوش مصنوعی محلی را به طرز قابل توجهی سریع و آسان کند.

با وجود محدودیت‌های عملکردی مدل محلی، این یک بخش مهم از چگونگی کمک هوش مصنوعی به افراد است. بیشتر افراد احتمالاً تمایل ندارند تمام داده‌های شخصی خود را به یک سرور دور ارسال کنند، اما مدل محلی می‌تواند این اطلاعات را به شیوه‌ای امن‌تر پردازش کند. به عنوان مثال، ویژگی تصاویر صفحه گوگل، تمام تصاویر صفحه شما را مشاهده می‌کند، اما همه پردازش‌ها روی گوشی شما انجام می‌شود. به طور مشابه، موتورولا در گوشی جدید Razr Ultra نوتیفیکیشن‌ها را به صورت محلی خلاصه می‌کند. در حالی که مدل پایه Razr که قابلیت کمتری دارد، نوتیفیکیشن‌ها را به سرور برای پردازش ارسال می‌کند.

انتشار APIهایی که به Gemini Nano متصل می‌شوند، می‌تواند به هوش مصنوعی موبایل ثبات و انسجام مورد نیاز را ببخشد. با این حال، این امر به همکاری گوگل و تولیدکنندگان اصلی تجهیزات (OEMs) در پشتیبانی از Gemini Nano بستگی دارد. برخی شرکت‌ها ممکن است تصمیم بگیرند به مسیر خود بروند و گوشی‌های زیادی وجود دارند که قدرت کافی برای اجرای هوش مصنوعی به صورت محلی را ندارند.

لینک کوتاه:

کپی شد

هوش مصنوعی