» تکنولوژی » اخبار کامپیوتر و موبایل » مدل هوش مصنوعی گوگل در جعل عکس های گوشی بسیار خوب است
مدل هوش مصنوعی گوگل در جعل عکس های گوشی بسیار خوب است
اخبار کامپیوتر و موبایل

مدل هوش مصنوعی گوگل در جعل عکس های گوشی بسیار خوب است

۱۳ آذر ۱۴۰۴ 0015

من شروع به درک نام مدل هوش مصنوعی بصری گوگل کرده ام، زیرا پس از چند روز بازی با آن، اینطور خلاصه می کنم: موز. تصاویری که تولید می کند آنقدر واقعی هستند که شبیه موز هستند. بعد از زل زدن طولانی مدت به آنها احساس می کنم دارم دیوانه می شوم. و اگر بخواهم به یک دلیل اشاره کنم که چرا تصاویر Nano Banana Pro بسیار واقعی تر از هوش مصنوعی پیش از آنها به نظر می رسند، این است: آنها شبیه عکس هایی هستند که با دوربین گوشی گرفته شده اند.

مطمئناً، اگر به دنبال آنها باشید، سرنخ ها وجود دارد. تصویر زوج (نه واقعی!) در پیاده رو شهر را در بالای این مقاله بگیرید. چراغ خیابان در پس زمینه به نظر من کاملاً درست نیست و برخی از نماهای ساختمان، به خصوص آنهایی که در پس زمینه قرار دارند، کمی عجیب و غریب و جعبه ای به نظر می رسند. اما اگر به سادگی این عکس را در شبکه های اجتماعی مرور می کردید، چه؟ به هیچ وجه آن را به عنوان هوش مصنوعی زمان نمی‌کنم. سوژه ها واقع گرایانه به نظر می رسند، اما من فکر می کنم این واقعیت که تصویر خیلی عالی به نظر نمی رسد چیزی است که آن را می فروشد.

کوه کمی بیش از حد بزرگ و دراماتیک است، اما نحوه رندر قایق، آب و شهر بسیار شبیه این است که یک تلفن آنها را نشان می دهد.
تصویر: نانو موز پرو

نوردهی صاف و روشن، عمق میدان سخاوتمندانه، جزئیات کمی ترد – همه اینها باعث می شود به دوربین تلفن فکر کنم. بن سندوفسکی، یکی از بنیانگذاران اپلیکیشن محبوب دوربین آیفون Halide، با این موضوع موافق است. در تصویر تولید شده توسط هوش مصنوعی از کشتی بالا، او خاطرنشان کرد: “شارپنس تصویر تهاجمی که در عکس های گوشی های هوشمند مشاهده می شود. این یک ترفند بصری است که به “پاپ” شدن تصویر کمک می کند.” یکی دیگر از ویژگی های بارز عکس های گرفته شده با گوشی؟ سر و صدا “بیشتر عکس های تولید شده با هوش مصنوعی بسیار تمیز به نظر می رسند. به نظر می رسد بافت این عکس ها از یک سنسور کوچک گوشی هوشمند گرفته شده است.”

رندر هوش مصنوعی از فضای داخلی یک اتوبوس شلوغ

حتی مسافران مترو کینگ کانتی تولید شده توسط هوش مصنوعی از برداشتن کوله پشتی خود در اتوبوس خودداری می کنند.
تصویر: نانو موز پرو

بنابراین هوش مصنوعی گوگل بینش خود را در مورد عکس های گوشی از کجا می آورد؟ به نظر می رسد Google Photos یک مکان بدیهی – و عمیقاً مشکل ساز – برای رفتن باشد، اما Elijah Lawal، رئیس ارتباطات جهانی اپلیکیشن Gemini، می گوید که «برای نانو موز ما از Google Photos استفاده نمی کنیم». همچنین به من می گوید که Nano Banana Pro به طور خاص برای ایجاد ظاهر و حس دوربین تلفن هدف گذاری نشده است. او می‌گوید: «یکی از پیشرفت‌های بزرگ این است که می‌تواند به جستجوی Google متصل شود. اگر از او بخواهید که یک اینفوگرافیک درباره آب و هوای امروز ایجاد کند، می تواند دما را بررسی کند—قبلاً باید اطلاعات بیشتری را در پیام خود قرار می دادید.

به گفته Lawal، این به جستجوی متن محدود می شود و نه جستجوی تصویر. اما توانایی انجام آن برو بگیر اطلاعات دنیای واقعی به تنهایی می تواند یک عنصر کلیدی در اینجا باشد. Nano Banana Pro به ویژه در افزودن عناصری به تصاویری که در آن زمینه منطقی هستند، خوب است، حتی اگر به طور خاص آنها را درخواست نکرده باشید. او می‌تواند عناصر تاریخی مانند لباس‌ها و ماشین‌های مناسب دوره را بدون اینکه به طور خاص به او گفته شود اضافه کند. او همچنین زمانی که از او خواستم یک فهرست جعلی برای یک خانه جعلی در سیاتل در Zillow ایجاد کند، یک واترمارک برای خدمات فهرست چندگانه Northwest اضافه کرد. او در درک کار و اضافه کردن جزئیات کوچک بدون اینکه از او خواسته شود بسیار بهتر می شود.

تصویر هوش مصنوعی از خانه ای به سبک صنعتگر

تصویر: نانو موز پرو

از جمینی درباره فهرستی در Zillow برای خانه ای به سبک صنعتگر با رنگ سفید و تزئینات مشکی در سیاتل غربی پرسیدم. فهرستی طولانی و فقط متنی که مکان را توصیف می‌کرد، برگرداند، اما با نکته‌ای دیگر، از Nano Banana Pro برای ایجاد تصویری مطابق با توضیحات استفاده کردم. من به طور خاص نپرسیدم، اما تصویر شامل حق چاپ 2023 است که واقعا سرگرم کننده است، و یک واترمارک مانند آنچه در تقریباً هر عکس املاکی که در منطقه مترو سیاتل پیدا می کنید یافت می شود. جالب اینجاست که این لوگوی فعلی نیست – بلکه نسخه قدیمی است که در هر عکس از خانه ای که در سال 2018 خریدم یکسان است.

من از گوگل پرسیدم که نانو موز کجا می‌توانست چنین چیزی را ارائه دهد، و ناینا رایسینگانی، مدیر محصول در DeepMind، پیشنهاد کرد که این یک توهم است و این جمله را ارائه کرد: «Nano Banana Pro ارتقاهای عمده‌ای را در سازگاری کاراکتر، تولید تصویر و دقت مبتنی بر جستجو ارائه می‌کند. در حالی که این دقیق‌ترین مدل تصویر ما تا به امروز است، ممکن است دوباره توهم‌های هوش مصنوعی را تشویق کنیم تا تصویر درستی داشته باشید. تلاش‌های بعدی اغلب نتیجه‌ای را به همراه می‌آورد که مطابق با نیات شما باشد.” نکته این است که اضافه کردن واترمارک برای خدمات فهرست املاک و مستغلات به نظر می رسد که الگو دقیقاً همانطور که انتظار می رود کار می کند.

واترمارک یا نه، تصور می‌کنم چاپ ریز روی تابلوی «فروشنده» ممکن است نشان‌دهنده هوش مصنوعی باشد، یا شاید گیاهان گلدانی روی ایوان کمی بیش از حد عالی به نظر می‌رسند، اما راستش؟ برای من سخت است که باور کنم این خانه واقعی نیست، حتی اگر در اعماق وجودم می دانم که اینطور نیست. اگر آن را در یک وب سایت املاک و مستغلات پیدا کنم و واترمارک قطعا به فروش آن به عنوان معتبر کمک می کند، دو بار فکر نمی کنم. اگر هوش مصنوعی در تقلید چیزهایی که نشان می‌دهند یک عکس واقعی است، اینقدر خوب است، پس بچه‌ها: ما آماده‌ایم.

تصویر هوش مصنوعی یک خبرنگار در اپل پارک

نانو موز چند نقطه مختلف اپل پارک را در اینجا ترکیب می کند، اما حال و هوای مناسبی دارد. جالب اینکه او یک پیرمرد را اضافه کرد در حد لوگوی اینجا هم باعث تعجب شما می شود.
تصویر: نانو موز پرو

این چیزی است که من را بیشتر نگران می‌کند: تشخیص سیگنال‌های هوش مصنوعی سخت‌تر می‌شود، و نانو موز در تقلید از جزئیات کوچکی که تصویر را واقعی به نظر می‌رسد بهتر می‌شود. ما به او چند پیشنهاد مبهم برای نمایندگی الف دادیم در حد خبرنگاری که یک رویداد زنده را پوشش می دهد. جزئیاتی مانند میکروفون با در حد لوگو در دست خبرنگار و یک شیرون در پایین صفحه. بدون غلط املایی یا حروف بیگانه. بدون دست شش انگشتی هیچ چیز به وضوح نشان دهنده هوش مصنوعی و جزئیات کوچک فراوان برای فروش آن به عنوان معامله واقعی نیست.

یک سال پیش، یا حتی چند ماه پیش، این احساس را داشتم که روزی در آینده خواهد آمد، روزی که باور کردن هر عکس یا ویدیویی که از منبعی ناشناخته آنلاین دیده‌ام غیرعاقلانه است، مگر اینکه خلاف آن ثابت شود. این تمرین مرا متقاعد کرد که آن روز در آینده نیست. الان اینجاست رادار هوش مصنوعی خود را به درستی بهینه کنید و اگر شما را دیوانه کند تعجب نکنید.

موضوعات و نویسندگان را دنبال کنید از این داستان برای مشاهده موارد بیشتر شبیه آن در فید صفحه اصلی شخصی خود و دریافت به‌روزرسانی‌های ایمیل.


منبع: theverge

به این نوشته امتیاز بدهید!

دیدگاهتان را بنویسید

  • ×