ایراد بزرگی که ژاپنیها در هوش مصنوعی مشهور پیدا کردند
تاریخ انتشار: ۲۶ شهریور ۱۴۰۲ | کد خبر: ۳۸۶۹۸۱۲۵
دولت ژاپن و شرکتهای بزرگ فناوری مانند NEC، فوجیتسو و سافتبانک صدها میلیون دلار برای ایجاد سیستمهای هوش مصنوعی صرف میکنند که بر اساس همان فناوری زیربنایی معروف به مدلهای زبانی بزرگ کار میکنند، اما به جای ترجمه نسخه انگلیسی از زبان ژاپنی استفاده میکنند.
به گزارش ایران اکونومیست؛ ژاپن در حال ساخت نسخههای خود از چت جیپیتی (ChatGPT) است.
بیشتر بخوانید:
اخباری که در وبسایت منتشر نمیشوند!
دولت ژاپن و شرکتهای بزرگ فناوری مانند NEC، فوجیتسو و سافتبانک صدها میلیون دلار برای ایجاد سیستمهای هوش مصنوعی صرف میکنند که بر اساس همان فناوری زیربنایی معروف به مدلهای زبانی بزرگ کار میکنند، اما به جای ترجمه نسخه انگلیسی از زبان ژاپنی استفاده میکنند.
کیسوکه ساکاگوچی (Keisuke Sakaguchi)، محقق دانشگاه توهوکو در ژاپن که متخصص پردازش زبان طبیعی است، میگوید: مدلهای زبانی بزرگ عمومی فعلی، مانند جیپیتی، در زبان انگلیسی برتری دارند، اما اغلب در زبان ژاپنی به دلیل تفاوت در سیستم الفبا، دادههای محدود و سایر عوامل دچار کاستی هستند.
تعصب زبان انگلیسی
مدلهای زبانی بزرگ به طور معمول از حجم عظیمی از دادهها و منابع در دسترس عموم برای یادگیری الگوهای گفتار و نثر طبیعی استفاده میکنند. آنها آموزش میبینند که کلمه بعدی را بر اساس کلمات قبلی در یک متن پیشبینی کنند. اکثریت قریب به اتفاق متنی که مدل قبلی چت جیپیتی یعنی جیپیتی -۳ (GPT-۳)، براساس آن آموزش داده شده بود، به زبان انگلیسی بود.
توانایی قابل توجه چت جیپیتی در برقراری مکالمات مشابه انسان، هم محققان را خوشحال و هم نگران کرده است. برخی آن را یک ابزار بالقوه برای صرفه جویی در نیروی کار میدانند در حالی که دیگران نگران هستند که از آن برای ساخت مقالات یا دادههای علمی استفاده شود.
در ژاپن، این نگرانی وجود دارد که سیستمهای هوش مصنوعی آموزشدیده بر روی مجموعههای داده به زبانهای دیگر نتوانند پیچیدگیهای زبان و فرهنگ ژاپن را درک کنند. ساختار جملات در زبان ژاپنی کاملا متفاوت از انگلیسی است؛ بنابراین چت جیپیتی باید یک درخواست ژاپنی را به انگلیسی ترجمه کند، پاسخ را بیابد و سپس پاسخ را به ژاپنی ترجمه کند.
در حالی که زبان انگلیسی تنها ۲۶ حرف دارد، زبان ژاپنی نوشتاری متشکل از دو مجموعه ۴۸ حرفی اصلی، به علاوه ۲۱۳۶ نویسه چینی یا کانجی است که به طور منظم استفاده میشود. اکثر کانجیها دو یا چند تلفظ دارند و ۵۰ هزار کانجی دیگر وجود دارد که به ندرت استفاده میشود. با توجه به این پیچیدگی، جای تعجب نیست که چت جیپیتی نتواند با این زبان دست و پنجه نرم کند.
ساکاگوچی میگوید در زبان ژاپنی، چت جیپیتی گاهی اوقات نویسههای بسیار کمیابی تولید میکند که اکثر مردم هرگز آنها را ندیدهاند و در نتیجه کلمات ناشناخته عجیب و غریب بهوجود میآید.
هنجارهای فرهنگی
برای اینکه یک مدل زبانی بزرگ مفید و حتی از نظر تجاری قابل دوام باشد، باید فرهنگ و همچنین زبان را به طور دقیق منعکس کند. برای مثال، اگر از چت جیپیتی خواسته شود که یک ایمیل درخواست شغل به زبان ژاپنی بنویسد، ممکن است عبارات استاندارد ادبی را حذف کند و نتیجه آن مانند ترجمهای واضح از انگلیسی به نظر برسد.
برای سنجش میزان حساسیت مدلهای زبانی بزرگ نسبت به فرهنگ ژاپنی، گروهی از محققان راکودا (Rakuda) را راه اندازی کردند. راکودا رتبه بندی است که نشان میدهد مدلهای زبانی بزرگ تا چه اندازه میتوانند به سوالات باز در مورد موضوعات ژاپنی پاسخ دهند.
سم پاساگلیا (Sam Passaglia)، بنیانگذار راکودا و همکارانش، از چت جیپیتی خواستند که روان بودن و تناسب فرهنگی پاسخها را با درخواستهای استاندارد مقایسه کند.
پاساگلیا، فیزیکدان دانشگاه توکیو که مدلهای زبان ژاپنی را مطالعه میکند، میگوید: مسلما مدلهای زبانی بزرگ ژاپنی بهبود زیادی مییابند، اما در حال حاضر آنها بسیار عقبتر از جیپیتی -۴ هستند. او میگوید، اصولا دلیلی وجود ندارد که یک مدل زبانی بزرگ ژاپنی نتواند در آینده برابر با جیپیتی-۴ باشد یا از آن پیشی بگیرد. این از نظر فنی قابل حل است، اما مشکل منابع وجود دارد.
یکی از تلاشها برای ایجاد یک مدل زبانی بزرگ ژاپنی استفاده از ابررایانه ژاپنی فوگاکو (Fugaku) است. فوگاکو که یکی از سریعترینهای جهان است عمدتا مدل زبانی را بر اساس ورودی ژاپنی آموزش میدهد.با حمایت موسسه فناوری توکیو، دانشگاه توهوکو، فوجیتسو و گروه مراکز تحقیقاتی ریکن (RIKEN) با بودجه دولتی، انتظار میرود مدل زبانی حاصل در سال آینده منتشر شود.
این مدل زبانی بزرگ برخلاف جیپیتی-۴ و سایر مدلهای اختصاصی، به سایر مدلهای زبانی منبع باز ملحق میشود تا کد خود را در دسترس همه کاربران قرار دهد. به گفته ساکاگوچی، که در این پروژه مشارکت دارد، محققان امیدوارند دستکم ۳۰ میلیارد پارامتر به آن بدهد که بر خروجی آن تأثیر میگذارد و میتوانند به عنوان معیاری برای اندازه آن عمل کند.
با این حال، مدل زبانی فوگاکو ممکن است توسط یک مدل حتی بزرگتر جانشین شود.
وزارت آموزش، فرهنگ، ورزش، علم و فناوری ژاپن بودجه ایجاد یک برنامه هوش مصنوعی ژاپنی را که مطابق با نیازهای علمی است، تامین میکند که با یادگیری از تحقیقات منتشر شده، فرضیههای علمی ایجاد کند و به شناسایی اهداف برای تحقیقات سرعت بخشد. این مدل میتواند با ۱۰۰ میلیارد پارامتر شروع به کار کند که کمی بیش از نیمی از اندازه جیپیتی-۳ است و به مرور زمان گسترش مییابد.
ماکوتو تایجی (Makoto Taiji)، معاون مرکز تحقیقات دینامیک بیوسیستم ریکن، در مورد این پروژه میگوید: امیدواریم چرخه تحقیقات علمی را به طور چشمگیری سرعت بخشیم و فضای جستجو را گسترش دهیم. توسعه مدل زبانی بزرگ دستکم ۳۰ میلیارد ین (۲۰۴ میلیون دلار آمریکا) هزینه خواهد داشت و انتظار میرود در سال ۲۰۳۱ به صورت عمومی منتشر شود.
گسترش قابلیتها
دیگر شرکتهای ژاپنی در حال تجاری سازی یا برنامهریزی برای تجاریسازی فناوریهای مدلهای زبانی بزرگ خود هستند.
سازنده ابر رایانه NEC در ماه مه استفاده از هوش مصنوعی مولد خود را بر اساس زبان ژاپنی آغاز کرد و ادعا میکند که این مدل زبانی زمان مورد نیاز برای ایجاد گزارشهای داخلی را ۵۰ درصد و کد منبع نرم افزار داخلی را ۸۰ درصد کاهش میدهد. در ماه ژوئیه، این شرکت شروع به ارائه خدمات هوش مصنوعی با قابلیت شخصیسازی به مشتریان کرد.
ماسافومی اویامادا (Masafumi Oyamada)، محقق اصلی در آزمایشگاههای علوم داده NEC، میگوید که میتوان از آن در طیف وسیعی از صنایع مانند صنایع مالی، حملونقل و تدارکات، توزیع و ساخت استفاده کرد. او اضافه میکند که محققان میتوانند آن را برای نوشتن کد، کمک به نوشتن و ویرایش مقالات و بررسی مقالات منتشر شده موجود استفاده کنند.
سافت بانک که ۴۰ میلیون مشتری دارد و با مایکروسافت سرمایه گذار شرکت OpenAI نیز شراکت دارد، میگوید که قصد دارد به شرکتها کمک کند تا کسب و کار خود را دیجیتالی کنند و بهرهوری خود را افزایش دهند. سافت بانک انتظار دارد که مدل زبانی بزرگ آنها توسط دانشگاهها، موسسات تحقیقاتی و سایر سازمانها مورد استفاده قرار گیرد.
در همین حال، محققان ژاپنی امیدوارند که یک چتبات هوش مصنوعی دقیق، موثر و ساخت ژاپن بتواند به سرعت بخشیدن به علم و پر کردن شکاف بین ژاپن و سایر نقاط جهان کمک کند.
منبع: ایران اکونومیست
کلیدواژه: مدل های زبانی بزرگ مدل زبانی بزرگ زبان انگلیسی مدل های زبان برای ایجاد زبان ژاپنی هوش مصنوعی چت جی پی تی سافت بانک بر اساس شرکت ها یک مدل
درخواست حذف خبر:
«خبربان» یک خبرخوان هوشمند و خودکار است و این خبر را بهطور اتوماتیک از وبسایت iraneconomist.com دریافت کردهاست، لذا منبع این خبر، وبسایت «ایران اکونومیست» بوده و سایت «خبربان» مسئولیتی در قبال محتوای آن ندارد. چنانچه درخواست حذف این خبر را دارید، کد ۳۸۶۹۸۱۲۵ را به همراه موضوع به شماره ۱۰۰۰۱۵۷۰ پیامک فرمایید. لطفاً در صورتیکه در مورد این خبر، نظر یا سئوالی دارید، با منبع خبر (اینجا) ارتباط برقرار نمایید.
با استناد به ماده ۷۴ قانون تجارت الکترونیک مصوب ۱۳۸۲/۱۰/۱۷ مجلس شورای اسلامی و با عنایت به اینکه سایت «خبربان» مصداق بستر مبادلات الکترونیکی متنی، صوتی و تصویر است، مسئولیت نقض حقوق تصریح شده مولفان در قانون فوق از قبیل تکثیر، اجرا و توزیع و یا هر گونه محتوی خلاف قوانین کشور ایران بر عهده منبع خبر و کاربران است.
خبر بعدی:
پاکسازی زبالههای فضایی با کمک فناوری ژاپنی
یک شرکت ژاپنی به نام Astroscale سیستمی را برای تصویربرداری از زبالههای فضایی توسعه داده است. این تصاویر به دانشمندان کمک میکند تا نحوه حرکت زبالهها را درک کنند و راههایی برای پاکسازی آنها از مدار زمین بیابند. - اخبار ویژه نامهها -
به گزارش خبرنگار فضا و نجوم خبرگزاری تسنیم، زبالههای فضایی شامل قطعات کوچک و بزرگی از تجهیزات دستساز بشر است که در مدار زمین رها شدهاند. این زبالهها میتوانند با سرعتهای باورنکردنی حرکت کنند و به ماهوارهها و فضاپیماها آسیب برسانند.
زبالههای فضایی شامل ماهوارههای شکسته، قطعات موشکهای دورانداخته شده و سایر قطعات کوچک و بزرگ فلزی است که اغلب سرعت زیادی در اطراف سیاره ما دارند. این زبالههای فضایی، ایستگاه فضایی بینالمللی و ایستگاه فضایی چین را تهدید میکنند و حتی برای ساکنان زمین نیز خطرناک است چراکه اخیراً شاهد فرود آمدن یک زباله فضایی بر سر یکی از ساکنان خانهای در ایالات متحده بودیم.
تلسکوپ فضایی هابل 34 ساله شدیک شرکت ژاپنی به نام Astroscale سیستمی را برای تصویربرداری از زبالههای فضایی توسعه داده است. این تصاویر به دانشمندان کمک میکند تا نحوه حرکت زبالهها را درک کنند و راههایی برای پاکسازی آنها از مدار زمین بیابند.
ماهواره Astroscale's Active Debris Removal by Astroscale-Japan (ADRAS-J) تصویر بالا را از مرحله بالایی یک موشک دور انداخته شده از فاصله چند صد متری گرفته است. ایده سیستم ADRAS-J بازرسی قطعات زباله و گرفتن عکس از آنها برای تعیین حرکات و وضعیت آنها است تا به درک چگونگی حرکت زباله برای عملیات حذف آتی کمک کند.
انتهای پیام/