گوگل با انتشار بهروزرسانی جدیدی برای دستیار هوش مصنوعی Gemini، گام مهمی در سادهتر و تعاملیتر کردن کار با تصاویر برداشته است. این آپدیت، قابلیتهایی را در اختیار کاربران قرار میدهد که ویرایش تصاویر، حاشیهنویسی و حتی تشخیص محتوای تولیدشده با هوش مصنوعی را سریعتر و لذتبخشتر از گذشته میکند.
در این نسخه، جمنای دیگر صرفاً یک ابزار متنی نیست، بلکه به یک محیط تعاملی برای کار مستقیم با تصاویر تبدیل شده است؛ تغییری که میتواند کاربردهای این هوش مصنوعی را برای کاربران عمومی و حرفهای بهطور همزمان گسترش دهد.
ویرایش مستقیم تصویر در Gemini با کمک هوش مصنوعی
مهمترین قابلیت این بهروزرسانی، امکان ویرایش مستقیم تصاویر داخل اپلیکیشن Gemini است. گوگل در این بخش از مدل هوش مصنوعی جدیدی با نام Nano Banana استفاده کرده که برای تعامل سریع و دقیق با تصاویر طراحی شده است.
کاربران میتوانند تنها با افزودن یک تصویر به کادر درخواست، وارد محیط ویرایش شوند و بدون نیاز به نوشتن دستورهای پیچیده، تغییرات دلخواه خود را اعمال کنند.
ابزارهای ویرایشی جدید چه امکاناتی دارند؟
پس از انتخاب تصویر، محیطی با عنوان Mark up در اختیار کاربر قرار میگیرد که شامل ابزارهای زیر است:
-
Sketch: امکان رسم آزاد روی تصویر، مشخصکردن نواحی خاص و برجستهسازی بخشهای مهم
-
Text: افزودن مستقیم متن روی تصویر، بدون نیاز به نرمافزار جانبی
-
Undo و Redo: بازگشت یا اصلاح تغییرات با یک کلیک
-
ویرایش بدون پرامپت: برخلاف بسیاری از ابزارهای هوش مصنوعی، استفاده از این قابلیتها الزاماً نیاز به وارد کردن دستور متنی ندارد
البته گوگل اعلام کرده در صورت تمایل، کاربران همچنان میتوانند توضیحات یا دستورات متنی خود را نیز به تصویر اضافه کنند تا نتیجه دقیقتری دریافت شود.
Nano Banana؛ مغز متفکر ویرایش تصویری جمنای
مدل Nano Banana بهطور خاص برای تعامل سریع، سبک و بصری طراحی شده است. تمرکز این مدل روی پردازش سریع تصاویر و اجرای تغییرات آنی است؛ موضوعی که باعث میشود تجربه کار با Gemini، بیشتر شبیه یک ابزار گرافیکی هوشمند باشد تا یک چتبات ساده.
این تغییر نشان میدهد گوگل در حال نزدیککردن هوش مصنوعی خود به کاربردهای روزمره مانند تولید محتوا، آموزش، طراحی، شبکههای اجتماعی و حتی استفادههای سازمانی است.
SynthID؛ گامی مهم برای شفافیت در محتوای ویدیویی
در کنار ویرایش تصویر، گوگل قابلیت SynthID را نیز یک قدم جلوتر برده است.
این فناوری که پیشتر برای شناسایی تصاویر تولیدشده با هوش مصنوعی استفاده میشد، اکنون به ویدیوها نیز گسترش یافته است.
SynthID به گوگل امکان میدهد محتوای ساختهشده با هوش مصنوعی را بهصورت نامحسوس نشانهگذاری کند؛ اقدامی که میتواند نقش مهمی در:
-
مقابله با اطلاعات جعلی
-
افزایش شفافیت محتوای دیجیتال
-
تشخیص ویدیوهای تولیدشده توسط AI
ایفا کند.
دسترسی و پشتیبانی پلتفرمها
قابلیتهای جدید Gemini هماکنون برای کاربران در پلتفرمهای زیر فعال شده است:
-
اندروید
-
iOS
-
نسخه وب
بهمحض بارگذاری اولین تصویر، محیط ویرایش جدید به کاربر معرفی میشود و نیازی به فعالسازی دستی ندارد.
جمعبندی؛ Gemini یک قدم جلوتر از یک چتبات ساده
بهروزرسانی جدید Gemini نشان میدهد گوگل بهدنبال تبدیل این ابزار به یک دستیار چندمنظوره واقعی است؛ ابزاری که نهتنها متن تولید میکند، بلکه امکان کار عملی با تصویر و ویدیو را نیز فراهم میسازد.
افزودن ویرایش تصویری تعاملی، مدل Nano Banana و توسعه SynthID، همگی نشاندهنده تمرکز گوگل بر آیندهای هستند که در آن هوش مصنوعی، بخشی جداییناپذیر از فرآیند تولید و مصرف محتوا خواهد بود.
اگر این روند ادامه پیدا کند، جمنای میتواند به یکی از جدیترین ابزارهای هوش مصنوعی برای کاربران عادی، تولیدکنندگان محتوا و کسبوکارها تبدیل شود.
هیچ نظری برای این پست وجود ندارد. اولین نفری باشید که نظر میدهید!