نقشه راه جدید “ابر اطلاعات” مایکروسافت بر کسب و کار متمرکز است
مصطفی سلیمان مدتی است که برای کار جدید خود آماده می شود. سلیمان اولین مدیر عامل هوش مصنوعی مایکروسافت است، اما پس از آن که شرکت در اواسط ماه مارس تحت یک بازسازی گسترده قرار گرفت، برخی از وظایف خود را واگذار کرد و تمرکز خود را به جستجوی ابر هوش معطوف کرد. او میگوید اگرچه این خبر تنها ماه گذشته منتشر شد حدبه مدت 9 ماه خود را برای انتقال آماده می کرد، و در حالی که مذاکره مجدد در مورد قرارداد مایکروسافت با OpenAI چیزی است که رسما “باز شد” [Microsoft’s] توانایی تعقیب ابرهوشی»، قبل از اینکه جوهر حتی خشک شود، برنامه ریزی کرده بود.
او گفت: «این یک برنامه بلندمدت بود» و افزود که دستیابی به ابرهوشی «صرفاً هدف من بود».
ابر هوش همراه با AGI یا هوش عمومی مصنوعی، تعریفی مبهم و در حال تغییر در صنعت هوش مصنوعی دارد. برای سلیمان، این موضوع به شدت در مورد تجارت و بهره وری است. سلیمان گفت: «فوق هوش واقعاً در مورد این سؤال است، «آیا این مدلها میتوانند ارزش محصول را برای میلیونها شرکتی که برای ارائه مدلهای زبانی در سطح جهانی به ما وابسته هستند، ارائه دهند؟» “این واقعاً هدف ما است. ما می خواهیم برای توسعه دهندگان، برای مشاغل و برای بسیاری از مصرف کنندگان ارائه دهیم.” شرکتهای هوش مصنوعی برای تولید درآمد بیشتر با فشار فزایندهای مواجه هستند و برنامههای مایکروسافت بازتاب استراتژی جدیدی برای OpenAI است.
سازماندهی مجدد مایکروسافت تیم های شرکت و مصرف کننده خود را تحت عنوان هوش مصنوعی Copilot ادغام کرد. در حالی که سلیمان به کار بر روی استراتژی کلی ادامه خواهد داد، ژاکوب آندرئو، که قبلاً معاون تولید و رشد شرکت مایکروسافت AI بود، معاون اجرایی آن شد و ابتکارات مهندسی، رشد، محصول و مهندسی تیمهای تازه ترکیب شده را رهبری میکند. این تغییر در زمانی که رقابت بین شرکتهای بزرگ هوش مصنوعی – و فشار برای جذب مصرفکننده و مشتریان سازمانی جدید – قویتر است، وقت خود را به تحقیق در مورد ابرهوش و توسعه مدلهای هوش مصنوعی مرزی جدید برای مایکروسافت اختصاص دهد.
روز پنجشنبه، مایکروسافت از یک مدل رونویسی جدید رونمایی کرد که امیدوار است این کار را انجام دهد، و از آنجایی که به گفته سلیمان، “نیمی از هزینه GPU سایر مدل های پیشرفته” هزینه دارد، این یک “صرفه جویی در هزینه” برای مایکروسافت است.
این شرکت، MAI-Transcribe-1 را با توانایی آن در رونویسی جلسات، شرح ویدیو و تجزیه و تحلیل مبادلات مرکز تماس به 25 زبان، به عنوان “لبه برش تشخیص گفتار” معرفی می کند. پستهای وبلاگ مایکروسافت که این مدل را اعلام میکنند میگویند که این مدل برای شرایط ضبط «سخت» از جمله نویز پسزمینه، صدای با کیفیت پایین و گفتار همپوشانی ایجاد شده است که بر روی ترکیبی از رونوشتهای «تأمینشده توسط انسان» و رونویسیشده توسط ماشین آموزش دیدهاند. سلیمان گفت که ضبطهای اصلی ترکیبی از دادههایی است که توسط غرفههای صدا و پیمانکارانی که وظیفه ضبط در میان سر و صدای پسزمینه، از خیابانهای شلوغ گرفته تا کودکانی که در اطراف میدوند، و همچنین «مقدار زیادی داده از وب باز» نظارت میشوند.
همراه با مدلهای موجود تولید صدا و تصویر MAI-Voice-1 و MAI-Image-2، مدل رونویسی جدید اکنون در Microsoft Foundry و به عنوان بخشی از زمین بازی جدید Microsoft AI در دسترس است. به گفته مایکروسافت، این اولین بار است که این الگوها “به طور گسترده برای استفاده تجاری در دسترس هستند.” MAI-Transcribe-1 می تواند فایل های صوتی را در فرمت های MP3، WAV و FLAC مدیریت کند.
سلیمان عملکرد مدل جدید در آزمایش را به یک تیم کوچک و متمرکز متشکل از 10 نفر نسبت می دهد. او میگوید که تیم مدلسازی «از همه بوروکراسیها رهایی یافته است»، زیرا یک تیم پیرامونی دارد که مسئول مدیریت فروشندگان، یافتن دادهها برای دانلود و موارد دیگر است. مایکروسافت از استراتژی مشابهی برای تولید صدا و تصویر استفاده کرده است و سایر شرکتها نیز حرکتهای مشابهی انجام دادهاند: متا، آمازون و گوگل در حال آزمایش برای صاف کردن سازمانهای خود هستند و آنتروپیک گفت که همچنین در حال آزمایش است که به تیمهای کوچک متشکل از چند توسعهدهنده کنترل آزاد با سطوح خاصی از محاسبات را بدهد تا ببینند به چه چیزی میتوانند دست پیدا کنند.
مدل رونویسی جدید بخشی از هدف سلیمان برای ارائه هوش مصنوعی “انسان محور” (نوعی از کلمه کلیدی مورد علاقه هوش مصنوعی مایکروسافت، “فوق هوش انسانی”) است که برای افراد روزمره مفید است. او گفت: «همه یک دستیار هوش مصنوعی در جیب خود خواهند داشت که واقعاً در سطح جهانی است، در مقابل آنها پاسخگو است، در کنار آنها، همسو با منافع آنها است و از طرف آنها کار می کند.
منبع: theverge
