پیام سپاهان

آخرين مطالب

انویدیا منتشر کرد: نسخه‌ای از مدل لاما 3.1 که کوچک‌تر و قوی‌تر از DeepSeek R1 است علمی

انویدیا منتشر کرد: نسخه‌ای از مدل لاما 3.1 که کوچک‌تر و قوی‌تر از DeepSeek R1 است
  بزرگنمايي:

پیام سپاهان - دیجیاتو / این مدل جدید باوجود اندازه کوچک‌تر عملکردی بهتر از DeepSeek R1 دارد.
متا همچنان درگیر پاسخ به پرسش‌ها و انتقادات درباره خانواده مدل‌های جدید Llama 4 است اما شرکت انویدیا با معرفی مدل زبان بزرگ (LLM) متن‌باز و قدرتمند، توجه‌ها را به خود جلب کرده است. این مدل که Llama-3.1 Nemotron Ultra نام دارد، بر پایه نسخه قبلی مدل‌های Llama-3.1-405B-Instruct متا توسعه یافته و به گفته انویدیا، عملکردی نزدیک به برترین مدل‌های موجود دارد.
مدل Llama-3.1-Nemotron-Ultra-253B-v1 با 253 میلیارد پارامتر برای وظایفی مانند استدلال پیشرفته، پیروی از دستورات و ایفای نقش دستیار هوش مصنوعی طراحی شده است.
این مدل نخستین‌ بار مارس در کنفرانس سالانه GTC انویدیا معرفی شده بود و اکنون کامل و متن‌باز در پلتفرم Hugging Face در دسترس قرار گرفته است. کد مدل، وزن‌ها و داده‌های پس از آموزش آن نیز عمومی منتشر شده‌اند.

پیام سپاهان


بازار


مدل جدید انویدیا با استفاده از فرایند جستجوی معماری عصبی (NAS) توسعه یافته که در آن نوآوری‌هایی مانند حذف لایه‌های توجه، شبکه‌های Fused feedforward و فشرده‌سازی متغیر در ساختار مدل اعمال شده‌اند. این معماری به گونه‌ای طراحی شده که مدل با کاهش مصرف حافظه و منابع محاسباتی، همچنان کیفیت خروجی بالایی ارائه دهد و بتوان آن را فقط با 8 کارت گرافیک H100 اجرا کرد.
علاوه‌بر H100، این مدل با معماری‌های پیشرفته‌تر انویدیا مانند B100 و Hopper نیز سازگار بوده و در حالت‌های دقت BF16 و FP8 عملکرد مطلوبی دارد.
انویدیا برای ارتقای توانایی‌های مدل از فرایند پس‌آموزش چندمرحله‌ای بهره برده که شامل آموزش نظارت‌شده در حوزه‌هایی مانند ریاضی، تولید کد، چت و استفاده از ابزارها بوده است. همچنین برای بهبود عملکرد در دنبال‌کردن دستورات و توانایی استدلال، از الگوریتم GRPO (بهینه‌سازی نسبی سیاست گروهی) استفاده شده است.
عملکرد مدل جدید انویدیا در برابر رقبا


مدل جدید انویدیا در آزمون‌های معتبر مختلف عملکرد خیره‌کننده‌ای داسته است. برای مثال، در آزمون MATH500، عملکرد مدل از 80.40 درصد در حالت عادی به 97 درصد در حالت استدلال افزایش یافته است. همچنین در آزمون AIME25، امتیاز آن از 16.67 درصد به 72.50 درصد و در LiveCodeBench از 29.03 درصد به 66.31 درصد رسیده است.
این مدل در پاسخ به پرسش‌های عمومی (GPQA) در حالت استدلال فعال به امتیاز 76.01 درصد دست یافته که از DeepSeek R1 (با امتیاز 71.5 درصد) پیشی گرفته است. همچنین در آزمون IFEval برای پیروی از دستورات، امتیاز 89.45 درصد در برابر 83.3 درصد رقیب ثبت شده و در LiveCodeBench نیز اندکی بهتر عمل کرده است.
البته باید توجه کرد که مدل DeepSeek R1 در برخی آزمون‌های ریاضی سنگین همچنان بهتر عمل می‌کند، ازجمله در AIME25 با امتیاز 79.8 درصد برابر 72.50 درصد مدل انویدیا.
این مدل از زبان‌های متعددی ازجمله انگلیسی، آلمانی، فرانسوی، ایتالیایی، پرتغالی، هندی، اسپانیایی و تایلندی پشتیبانی می‌کند و برای کاربردهایی مانند چت‌بات، ساخت عامل‌های هوش مصنوعی، تولید کد و تولید با روش بازیابی-افزوده (RAG) قابل‌استفاده است.

لینک کوتاه:
https://www.payamesepahan.ir/Fa/News/954565/

نظرات شما

ارسال دیدگاه

Protected by FormShield
مخاطبان عزیز به اطلاع می رساند: از این پس با های لایت کردن هر واژه ای در متن خبر می توانید از امکان جستجوی آن عبارت یا واژه در ویکی پدیا و نیز آرشیو این پایگاه بهره مند شوید. این امکان برای اولین بار در پایگاه های خبری - تحلیلی گروه رسانه ای آریا برای مخاطبان عزیز ارائه می شود. امیدواریم این تحول نو در جهت دانش افزایی خوانندگان مفید باشد.

ساير مطالب

هشدار امام جمعه اصفهان درباره پیامدهای بی‌حجابی

واکنش مجتبی جباری به شایعه راه‌رفتن در اصفهان!

زارع: رقابت‌های سختی داشتیم؛ برای جهانی تلاش مضاعفی خواهیم داشت

شبا نذاره غصه و تنهایی مزاحمت شه!

ز دور باش حوادث دلم

جدیدترین تصاویر تبلیغاتی گلکسی S25 اج از عمر باتری 1 روزه خبر می‌دهند

صدا، دوربین، سیگار، حرکت!

صعود مقتدرانه بسیجیان منتخب به قله برف انبار

حقایق تاریخی ایران با سیاست بازی قابل حذف و انکار نیست

لیموچی به اصفهان برنگشت!

امام جمعه اصفهان: بی‌حجابی و بی‌عفتی نشانه کم‌حیایی است/ اگر انسان از درون اهل حیا باشد، این ویژگی در پوشش و رفتار او نیز تجلی می‌یابد

اصفهان، آیینه‌ای از حرم در شب میلاد امام رضا(ع)

وضع مالی بد فردوسی!

داره فعل مجهول رو درس میده!

ویجت نوار جستجو گوگل در اندروید بازطراحی خواهد شد

سهمیه قیر استان اصفهان کفاف نیاز استان را نمی‌دهد/

تحقق شعار استفاده بهینه از سوخت و هوای پاک با توسعه خودروهای برقی در شهرها

افتتاح بوستان شورا در گلپایگان با حضور معاون عمرانی استاندار اصفهان

کشف نیمه پنهان اصفهان هدفگذاری آینده جذب گردشگر در اصفهان است

اصفهان به دنبال احیای گونه‌های متنوع گردشگری است

برگزاری رویدادهای بین‌المللی ورزشی در اصفهان پیام‌های مثبتی دارد

دیگه به هیچ خوشی اعتماد ندارم!

حتی اگر نباشی می آفرینمت!

نینتندو به پشتیبانی از کنسول سوییچ ادامه می‌دهد

دولت دوم ترامپ به دنبال تغییر بنیادین در سیاست خارجی آمریکاست

پیگیری رقابت‌های کشتی آزاد جام تختی در اصفهان

آمریکا در تیران و صنافیر مستقر می‌شود؟؛ تشدید رقابت میان واشنگتن و پکن – آفتاب نو | اخبار ورزشی

نفرات راه یافته به مرحله نیمه نهایی پنج وزن دوم کشتی آزاد جام تختی مشخص شد

امام جمعه موقت اصفهان: مدیریت ناترازی انرژی نیازمند همکاری همگانی است

سازمان‌های بین المللی در زمینه جنایات رژیم صهیونیستی سکوت کرده‌اند

شعرخوانی زیبای دکتر کاکاوند

اپراتور آمریکایی با تحویل‌گرفتن گوشی‌های شکسته، دستگاه نو به مردم تحویل می‌دهد

گریۀ شهید رئیسی با شنیدن رنج کشاورزان اصفهانی

آمریکا در تیران و صنافیر مستقر می‌شود؟؛ تشدید رقابت میان واشنگتن و پکن

یک هندی طلایی وزن عموزاد شد؛ چهارمین ملی‌پوش از اصفهان درآمد/ بذری قهرمان غیرمنتظره!

اصفهان گرم‌تر می‌شود

غزل زیبای سعدی

مشخصات کلیدی سری وان پلاس Ace 6 لو رفت: تراشه اسنپدراگون و باتری 7800mAh

تلاش خاموش هند و پاکستان برای تنش زدایی در میانه‌ی موشک‌پراکنی

آخرین قیمت سوییت‌های فروشی در اصفهان + جدول

برگزاری گردهمایی دوست‌داران امام رضا (ع) فردا در دانشگاه الزهرا (س)

رقابت حساس سنگین وزن ها در اصفهان/ زارع و معصومی یک گام تا فینال

امیرحسین زارع، محبی را شکست داد؛ پادشاه در اصفهان تاج گذاری می کند

سخنان دلنشین دکتر کاکایی

سخنان ارزشمند دکتر قمشه ای

فناوری نمایشگر آیفون تاشو اپل استانداردهای جدیدی را تعیین خواهد کرد

مدیر سابق اپلیکیشن فیسبوک به استخدام OpenAI درآمد

دستیار ویژه ریگان: آیا ترامپ به جنگ با ایران «نه» می‏‌گوید؟

بیداری ظرفیت‌های خفته جامعه در راستای گفتمان دولت وظیفه فرمانداران است

هیئت‌های مذهبی نقش مهمی در همبستگی اجتماعی مردم دارند