مدل جدید AI AI Anthropic از “استدلال ترکیبی” هوشمندانه ترین آن است
Anthropic Claude 3.7 Sonnet را منتشر می کند ، اولین “مدل استدلال ترکیبی” که می تواند مشکلات پیچیده تری را حل کند و مدلهای قبلی را بیش از حد در زمینه هایی مانند ریاضیات و برنامه نویسی انجام دهد.
علاوه بر یک مدل جدید ، Anthropic همچنین یک “پیش نمایش تحقیق” از ابزار کدگذاری “عامل” خود به نام Claude Code را منتشر می کند. می توانید کد را جستجو و خواندن ، ویرایش پرونده ها ، نوشتن و انجام تست ، متعهد و فشار کد را در GitHub و استفاده از ابزارهای ردیف خط فرمان “.
Claude 3.7 Sonnet از روز دوشنبه در برنامه Claude و برای توسعه دهندگان از طریق API انسان شناسی ، آمازون Bedrock و Vertix AI DI Google Cloud در دسترس است. این مدل هزینه مشابهی را به عنوان سلف خود ، 3.5 غزل ، با 3 دلار در هر میلیون نشانه ورودی و 15 دلار در هر میلیون نشانه خروجی انجام می دهد.
در حالی که Openai و دیگران مدل های استدلال جداگانه ای را ارائه می دهند ، می گوید جستجوی محصولات انسان شناسی Dianne Penn نقطه که این شرکت می خواست تجربه استفاده از یک مدل را ساده کند. او می گوید: “اساساً ما معتقدیم كه استدلال یك ویژگی هوش مصنوعی است نه چیزی كه كاملاً جداگانه باشد.” در برابر پاسخ به یک فوریت پیچیده تر ، “برنامه ریزی یک سفر دو هفته ای به ایتالیا در حالی که در پایان ماه مارس زمان را در نظر می گیرد”.
پن اظهار داشت که Claude 3.7 Sonnet به طور قابل توجهی بهتر در “برنامه نویسی عامل” ، بودجه و فعالیت های حقوقی است. در حالی که کلود هنوز مانند سایر مدل ها فاقد تحقیقات وب در زمان واقعی است ، تاریخ قطع دانش نسخه 3.7 اکتبر 2024 بیشتر به روز می شود. Anthropic همچنین به توسعه دهندگان این امکان را می دهد تا از طریق Scratchpad خود روش “فکر” را راهنمایی کنند و حتی دیکته کنند که دقیقاً چه مدت طول می کشد تا پاسخ دهد. مایکل گرستنهابر ، معاون رئیس جمهور انسان شناسی می گوید: “گاهی اوقات توسعه دهنده باید بگوید که برای پاسخ به این سؤال نباید بیش از 200 میلی ثانیه نیاز داشته باشد.” “و این یک تصمیم محصول است.”
در داخل انسان شناسی ، کارمندان از مدل جدید برای ایجاد وب سایت های جلویی ، بازی های تعاملی و حتی 45 دقیقه در کار برنامه نویسی “تست های ساخت و اصلاح موارد آزمایش و آزمایش های عقب مانده” استفاده کردند.
او می گوید که این شرکت همچنین با نقشه برداری از زنبورهای مدل به یک الگوی کنترلر ، مدل های خود را در مورد توانایی خود در پیشرفت از طریق یک بازی ویدیویی Pokémon قدیمی آزمایش می کند. Claude 3.5 Sonnet در ابتدای بازی نتوانست پالت شهر را ترک کند در حالی که نسخه 3.7 توانست رهبران بیشتری را از ورزشگاه شکست دهد.
همانطور که هفته گذشته الون مسک با Grok-3 نشان داد ، مسابقه مدل AI فوق العاده سریع در حال حرکت است. در حال حاضر ، به نظر می رسد که Anthropic به لطف درآمد عملکرد Claude 3.7 Sonnet دوباره در صدر جدول قرار دارد. خروج آن همچنین حاکی از آن است که ، به جای ارائه مدلهای استدلال خودمختار ، صنعت به سمت آینده ای حرکت می کند که در آن یک مدل می تواند همه کارها را انجام دهد.
منبع: theverge