آپدیت جدید هوش مصنوعی Gemini

آپدیت جدید Gemini گوگل؛ تجربه ویرایش تصویر وارد مرحله‌ای تازه شد

گوگل با انتشار به‌روزرسانی جدیدی برای دستیار هوش مصنوعی Gemini، گام مهمی در ساده‌تر و تعاملی‌تر کردن کار با تصاویر برداشته است. این آپدیت، قابلیت‌هایی را در اختیار کاربران قرار می‌دهد که ویرایش تصاویر، حاشیه‌نویسی و حتی تشخیص محتوای تولیدشده با هوش مصنوعی را سریع‌تر و لذت‌بخش‌تر از گذشته می‌کند.

در این نسخه، جمنای دیگر صرفاً یک ابزار متنی نیست، بلکه به یک محیط تعاملی برای کار مستقیم با تصاویر تبدیل شده است؛ تغییری که می‌تواند کاربردهای این هوش مصنوعی را برای کاربران عمومی و حرفه‌ای به‌طور هم‌زمان گسترش دهد.

ویرایش مستقیم تصویر در Gemini با کمک هوش مصنوعی

مهم‌ترین قابلیت این به‌روزرسانی، امکان ویرایش مستقیم تصاویر داخل اپلیکیشن Gemini است. گوگل در این بخش از مدل هوش مصنوعی جدیدی با نام Nano Banana استفاده کرده که برای تعامل سریع و دقیق با تصاویر طراحی شده است.

کاربران می‌توانند تنها با افزودن یک تصویر به کادر درخواست، وارد محیط ویرایش شوند و بدون نیاز به نوشتن دستورهای پیچیده، تغییرات دلخواه خود را اعمال کنند.

ابزارهای ویرایشی جدید چه امکاناتی دارند؟

پس از انتخاب تصویر، محیطی با عنوان Mark up در اختیار کاربر قرار می‌گیرد که شامل ابزارهای زیر است:

  • Sketch: امکان رسم آزاد روی تصویر، مشخص‌کردن نواحی خاص و برجسته‌سازی بخش‌های مهم

  • Text: افزودن مستقیم متن روی تصویر، بدون نیاز به نرم‌افزار جانبی

  • Undo و Redo: بازگشت یا اصلاح تغییرات با یک کلیک

  • ویرایش بدون پرامپت: برخلاف بسیاری از ابزارهای هوش مصنوعی، استفاده از این قابلیت‌ها الزاماً نیاز به وارد کردن دستور متنی ندارد

البته گوگل اعلام کرده در صورت تمایل، کاربران همچنان می‌توانند توضیحات یا دستورات متنی خود را نیز به تصویر اضافه کنند تا نتیجه دقیق‌تری دریافت شود.

Nano Banana؛ مغز متفکر ویرایش تصویری جمنای

مدل Nano Banana به‌طور خاص برای تعامل سریع، سبک و بصری طراحی شده است. تمرکز این مدل روی پردازش سریع تصاویر و اجرای تغییرات آنی است؛ موضوعی که باعث می‌شود تجربه کار با Gemini، بیشتر شبیه یک ابزار گرافیکی هوشمند باشد تا یک چت‌بات ساده.

این تغییر نشان می‌دهد گوگل در حال نزدیک‌کردن هوش مصنوعی خود به کاربردهای روزمره مانند تولید محتوا، آموزش، طراحی، شبکه‌های اجتماعی و حتی استفاده‌های سازمانی است.

SynthID؛ گامی مهم برای شفافیت در محتوای ویدیویی

در کنار ویرایش تصویر، گوگل قابلیت SynthID را نیز یک قدم جلوتر برده است.

این فناوری که پیش‌تر برای شناسایی تصاویر تولیدشده با هوش مصنوعی استفاده می‌شد، اکنون به ویدیوها نیز گسترش یافته است.

SynthID به گوگل امکان می‌دهد محتوای ساخته‌شده با هوش مصنوعی را به‌صورت نامحسوس نشانه‌گذاری کند؛ اقدامی که می‌تواند نقش مهمی در:

  • مقابله با اطلاعات جعلی

  • افزایش شفافیت محتوای دیجیتال

  • تشخیص ویدیوهای تولیدشده توسط AI

ایفا کند.

دسترسی و پشتیبانی پلتفرم‌ها

قابلیت‌های جدید Gemini هم‌اکنون برای کاربران در پلتفرم‌های زیر فعال شده است:

  • اندروید

  • iOS

  • نسخه وب

به‌محض بارگذاری اولین تصویر، محیط ویرایش جدید به کاربر معرفی می‌شود و نیازی به فعال‌سازی دستی ندارد.

جمع‌بندی؛ Gemini یک قدم جلوتر از یک چت‌بات ساده

به‌روزرسانی جدید Gemini نشان می‌دهد گوگل به‌دنبال تبدیل این ابزار به یک دستیار چندمنظوره واقعی است؛ ابزاری که نه‌تنها متن تولید می‌کند، بلکه امکان کار عملی با تصویر و ویدیو را نیز فراهم می‌سازد.

افزودن ویرایش تصویری تعاملی، مدل Nano Banana و توسعه SynthID، همگی نشان‌دهنده تمرکز گوگل بر آینده‌ای هستند که در آن هوش مصنوعی، بخشی جدایی‌ناپذیر از فرآیند تولید و مصرف محتوا خواهد بود.

اگر این روند ادامه پیدا کند، جمنای می‌تواند به یکی از جدی‌ترین ابزارهای هوش مصنوعی برای کاربران عادی، تولیدکنندگان محتوا و کسب‌وکارها تبدیل شود.

آنچه در این مقاله میخوانید
آذر 29, 1404
بدون دیدگاه
3 دقیقه زمان مطالعه
۲هزار بازدید
دسته بندی :
تگ ها :
اشتراک گذاری :

دیدگاه کاربران

دیگر کاربران چه میگویند؟

هیچ نظری برای این پست وجود ندارد. اولین نفری باشید که نظر می‌دهید!

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

For security, use of Google's reCAPTCHA service is required which is subject to the Google Privacy Policy and Terms of Use.

مقالات بیشتر