آیا لاما ۳ میتواند دنیای مدلهای زبانی را متحول کند
اگرچه لاما ۳ هنوز یک مدل زبانی متنمحور است، اما قابلیتهای فعلی و آپدیتهای آتی میتوانند این مدل زبانی را بیشتر برجسته کند.
چندی قبل بود که OpenAI از GPT-4o رونمایی کرد و گوگل نیز طی رویداد I/O 2024 از حضور جمینای در مرورگر کروم خبر داد. بااینحال بازیگر دیگری که نباید فراموش کنیم، مدل زبانی بزرگ متا، یعنی Llama 3 است. مدل زبانی متا توسط تعدادی زیادی از کاربران استفاده میشود و متنباز بودن آن در کنار سایر قابلیتها موجب شده است تا رقیب جدی سایر پلتفرمها مانند ChatGPT و جمینای نام بگیرد. همچنین برخی از توسعهدهندگان، لاما ۳ را در برخی زمینهها برتر از سایر رقبا میدانند و طبق بنچمارکهایی که از آن در پردازش محاسبات، ریاضیات و دانش عمومی منتشر شده، عملکرد مدل زبانی جدید متا را سریعتر و دقیقتر ارزیابی میکنند.
دسترسی عموم کاربران به لاما ۳
هنگام رونمایی از ChatGPT، تنها تعداد کمی از کاربران با این مدل زبانی آشنا بودند و این چتبات بهمرور زمان و با عملکرد خیرهکنندهاش، توانست طیف عظیمی از کاربران را در مدت زمان کوتاهی جذب خود کند. اما برخلاف ChatGPT، لاما ۳ در شبکههای مجازی متا مانند اینستاگرام، فیسبوک و واتساپ در دسترس خواهد بود و میلیاردها کاربر از خدمات آن بهره خواهند برد. در نتیجه برنامهریزی درست و استفاده از این ظرفیت بالای کاربری، میتواند لاما ۳ را جلوتر از رقیبانش بهعنوان بهترین مدل زبانی حالحاضر معرفی کند.
کاملاً رایگان
تجربه نشان داده که متا عجله چندانی برای درآمدزایی از سرویسهای خود ندارد، برخلاف دیگر شرکتها که به علت سرمایهگذاریهای هنگفت در این زمینه، به بازگشت نسبتاً سریع سرمایهشان فکر میکنند.
متا با ساخت زیرساختهای مناسب برای نگهداری از دادهها و درآمدزایی از خدمات مختلف خود، میتواند لاما ۳ را رایگان در اختیار عموم کاربرانش قرار دهد. همچنین متا با سرمایهگذاریهای بیشتر در آینده، قدرت محاسباتی مدل زبانی خود را افزایش خواهد داد تا کاربران بهصورت رایگان به این مدل زبانی دسترسی داشته باشند.
لاما ۳، مدل زبانی متنباز
اگرچه عموم کاربران به هزینه اشتراک این مدلها توجه میکنند؛ اما توسعهدهندگان متنباز بودن مدلهای زبانی را یک مزیت میدانند. درنتیجه لاما ۳ نیز بهعنوان یک مدلزبانی متنباز این اجازه را به توسعهدهندگان میدهد تا بتوانند نحوه اجرای دستورات را در این مدل زبانی ببینند و سپس تغییرات مدنظرشان را اعمال کنند. درنتیجه متخصصان بیشتری در توسعه لاما ۳ نقش خواهند داشت و روند گسترش و تقویت این مدل زبانی با سرعت بیشتری پیش خواهد رفت.
عملکرد سازگار و بهینه لاما ۳
بسیاری از مدلهای زبانی فعلی علیرغم عملکرد مناسب، وابستگی بالایی به پردازش و قدرت محاسباتی دارند؛ بدین معنی که این مدلها به منابع قدرتمندی برای پردازش محاسبات وابستهاند که گاهاً این موضوع نهتنها در آموزش مدلها، بلکه در پردازش پاسخها نیز آنها را با مشکل مواجه میکند و تأخیر در پاسخدهی را بههمراه دارد.
اما لاما ۳ را میتوان از این قضیه مستثناء دانست؛ زیرا این مدل قادر است تا روی سختافزار لپتاپهای معمولی نیز اجرا شود و راهکارهایی برای کاهش بار محاسباتی ارائه دهد. درحالحاضر این مدل زبانی از ۷۰ میلیارد پارامتر در ارائه پاسخهای خود استفاده میکند، درحالیکه نسخههای داخلی لاما از حداکثر ۴۰۰ میلیارد پارامتر بهرهمندند. درنتیجه این فناوری نشان میدهد که احتمالاً در آینده نزدیک میتوانیم تواناییهای هوش مصنوعی را در دستگاههای کوچکتری مانند موبایلها، عینکهای هوشمند و هدستهای VR ببینیم.
جمعبندی
اگرچه لاما ۳ کمی متفاوت از سایر مدلهای زبانی عمل میکند، اما هنوز از قابلیتهای کلیدی که رقبایش ارائه میدهند، محروم است. این مدل زبانی هنوز متنمحور است و نمیتواند نقش یک هوش مصنوعی چندوجهی را ایفا کند. همچنین قادر به پردازش ویدیو، صدا و تصاویر نیست و به دستورات صوتی کاربران نیز پاسخ نمیدهد. علاوهبراین، کاربران تنها با زبان انگلیسی میتوانند با لاما ۳ ارتباط برقرار کنند. اما این مشکلات نیز بهزودی رفع خواهند شد تا لاما ۳ بتواند با پتانسیل بالاتری درزمینه پردازش محاسبات و پاسخگویی به کاربران عمل کند و کمی متفاوت از سایر رقبا ظاهر شود.
انتهای پیام