مباحث اي تي و هوش مصنوعی

هدستی که ترس از سخنرانی را کاهش می‌دهد

یک دانشمند «دانشگاه کمبریج» یک هدست واقعیت مجازی ابداع کرده است که می‌تواند حتی ترسناک‌ترین مخاطبان را شبیه‌سازی کند تا میزان ترس کاربر را از سخنرانی کاهش دهد.

وقتی نظرسنجی‌ها از مردم درباره بزرگ‌ترین ترس آنها می‌پرسند، سخن‌رانی در جمع اغلب در صدر فهرست قرار می‌گیرد و حتی از مرگ نیز پیشی می‌گیرد.

دکتر «کریس مک‌دونالد»(Chris Macdonald) دانشمند «دانشگاه کمبریج»(Cambridge University) معتقد است پادزهری را برای علائمی مانند عرق کردن کف دست‌ها و ضربان تند قلب دارد که بسیاری از ما آنها را هنگام سخنرانی تجربه می‌کنیم . مک‌دونالد قصد دارد اختراع خود را به صورت رایگان در دسترس قرار دهد.

این سیستم به یک اسپیکر امکان می‌دهد تا از یک تلفن هوشمند معمولی به عنوان هدست واقعیت مجازی استفاده کند. کاربران با کمک این سیستم می‌توانند سخنرانی را در حضور مخاطبانی که بزرگ و ترسناک به نظر می‌رسند، تمرین کنند.

بررسی‌های انجام‌شده روی شرکت‌کنندگان پژوهش نشان داد که این سیستم کارآیی دارد؛ به طوری که وقتی شرکت‌کنندگان واقعا در انظار عمومی صحبت کردند، اعتماد به نفس بیشتری داشتند.

مک‌دونالد گفت: من کار خود را با یک ماموریت ساده اما جاه‌طلبانه آغاز کردم. من تصمیم گرفتم مؤثرترین درمان را برای رایج‌ترین ترس ابداع کنم و آن را آزادانه در دسترس همه قرار دهم. لطفا از آن استفاده کنید زیرا زندگی شما را متحول می‌کند و فرصت‌های شما را بسیار گسترش می‌دهد.

این سیستم موسوم به «Virtual Reality Public Speaking Platform» شامل استفاده از یک پایه برای تبدیل تلفن همراه به هدست است. نسخه مورد استفاده در آزمایش مک‌دونالد حدود ۱۷ پوند قیمت دارد اما نسخه‌های پایین‌تر را می‌توان با حدود ۶ پوند خریداری کرد.

این سیستم کاربران را در محیط‌های گفتاری شبیه‌سازی‌شده قرار می‌دهد. این محیط‌ها چالش‌برانگیزتر از موقعیت واقعی هستند که کاربران در نهایت با آن روبه‌رو خواهند شد. برای مثال، کاربر با کمک این سیستم می‌تواند در یک استادیوم مجازی با ۱۰ هزار تماشاگر متحرک سخن‌رانی کند.

در سالن‌های کوچک‌تر، تماشاگران وانمود می‌کنند که خسته هستند و با تلفن‌ همراه خود حرف می‌زنند. حتی ممکن است برخی از تماشاگران بیرون بروند. هدف این است که صحبت کردن در دنیای واقعی برای کاربر قابل کنترل باشد.

این پژوهش که با شرکت ۲۹ نوجوان انجام شد، نشان داد که یک جلسه ۳۰ دقیقه‌ای بر آنها تأثیر داشته است. به شرکت‌کنندگان یک روش آرام‌بخش موسوم به ۸-۷-۴ نیز آموزش داده شد که شامل تنفس از بینی برای شمارش ۴، حبس نفس برای شمارش ۷ و بازدم از دهان برای شمارش ۸ است.

شرکت‌کنندگان پیش از برگزاری جلسه، اعتمادبه‌نفس خود را برای صحبت کردن در جمع ۳۱ درصد توصیف کردند اما پس از جلسه، اعتمادبه‌نفس آنها به ۷۹ درصد رسید.

دانشجویان کمبریج و کالج دانشگاهی لندن با آزمایش‌های بیشتر نشان دادند که یک هفته استفاده از این سیستم، بهبود قابل ‌توجهی را در احساس آمادگی افراد و اعتمادبه‌نفس کلی آنها به همراه داشته است. حتی برخی از شرکت‌کنندگان از سخن‌رانی لذت بردند.

مک‌دونالد گفت: بیشتر دانش‌آموزان معمولا پیش از سخن‌رانی تمایل دارند به تنهایی در اتاق‌ خواب‌ خود و بدون حضور مخاطب تمرین کنند. در نتیجه، زمانی که آنها حتی در حضور گروه کوچکی از افراد سخن‌رانی می‌کنند، در حال برداشتن یک گام مهم هستند و حتی یک حرکت کوچک مخاطب می‌تواند تلاش آنها را از بین ببرد. دانش‌آموزانی که از پلتفرم واقعیت مجازی استفاده می‌کنند، می‌توانند هر شب در مکان‌های متفاوتی تمرین کنند تا شرایط وحشت‌آور و طیف گسترده‌ای از مخاطبان را تجربه کنند که امکان دارد حواس آنها را ‌پرت کنند. این بدان معناست که ارائه واقعی به یک گروه کوچک، ساده‌تر به نظر می‌رسد.

+ نوشته شده در دوشنبه بیست و هفتم اسفند ۱۴۰۳ ساعت 10:12 توسط شهرام |

رقابت بایدو با دیپ‌سیک شدت گرفت

موتور جستجوگر بایدو (Baidu) چین از دو مدل جدید هوش مصنوعی را با شدت گرفتن رقابت در این عرصه، رونمایی کرده است.

بایدو از دو مدل جدید هوش مصنوعی رونمایی کرده است که از جمله آنها می‌توان به ارنی‌ایکس ۱ (ERNIE X1) اشاره کرد که ادعا می‌شود با نیمی از هزینه ساخت دیپ‌سیک آر۱ (DeepSeek R1) و با عملکرد مشابه ایجاد شده است.

بایدو چین اعلام کرده است که دو مدل هوش مصنوعی جدید از جمله یک مدل جدید مبتنی بر استدلال را راه اندازی کرده که به گفته این شرکت با مدل دیپ‌سیک رقابت می‌کند. بایدو در رقابت شدید در عرصه هوش مصنوعی، تلاش می‌کند.

استارت‌آپ چینی هوش مصنوعی دیپ‌سیک (DeepSeek) که مدل‌های هوش مصنوعی را عرضه می‌کند که به گفته آن‌ها با کسری از هزینه همتراز با مدل‌های پیشروی این صنعت در ایالات متحده پیش می‌رود یا حتی بهتر از آنها عمل می‌کند، به تازگی عرصه هوش مصنوعی را تحت تاثیر قرار داده و رقابت جهانی هوش مصنوعی را بار دیگر تقویت کرده است.

بایدو در مورد یکی از مدل‌های جدید خود به نام ارنی‌ایکس ۱ توضیح داد: این هوش مصنوعی عملکردی برابر با مدل دیپ‌سیک آر۱ دارد و تنها با نصف هزینه ساخته شده‌ است. بایدو گفت که X1 قابلیت‌های درک، برنامه‌ریزی، بازتاب و تکامل قوی‌تری دارد و افزود که این اولین مدل تفکر عمیق است که از ابزارها به طور مستقل استفاده می‌کند.

بایدو همچنین افزود که جدیدترین مدل پایه آن به نام ERNIE ۴.۵ قابلیت درک چندوجهی عالی و توانایی زبانی پیشرفته‌تری دارد و توانایی‌های درک، تولید، منطق و حافظه آن به طور جامع بهبود یافته است.

بایدو افزود که این هوش مصنوعی همچنین دارای EQ بالا است و درک الگوهای رفتاری شبکه و انیمیشن‌های طنز برای آن آسان است.

بایدو که یکی از اولین غول‌های فناوری چین است که یک چت‌بات به سبک چت جی‌پی‌تی راه‌اندازی کرد، با وجود ادعای ارائه عملکرد قابل مقایسه با جی‌پی‌تی -۴ (GPT-4)، در میان رقابت شدید، در تلاش برای به دست آوردن پذیرش گسترده برای مدل زبانی بزرگ ارنی (Ernie) خود بود.

سیستم‌های هوش مصنوعی چندوجهی قادر به پردازش و ادغام انواع مختلف داده‌ها از جمله متن، ویدئو، تصویر و صدا هستند و می‌توانند محتوا را در این قالب‌ها به هم تبدیل کنند.

+ نوشته شده در دوشنبه بیست و هفتم اسفند ۱۴۰۳ ساعت 10:3 توسط شهرام |

رقابت داغ در گیمینگ: Ryzen 9 9950X3D تا ۲۰٪ سریع‌تر از Core i9 285K

مدل 9950X3D در ۴۰ بازی مختلف تا ۲۰ درصد سریع‌تر از Core i9 285K اینتل عمل می‌کند و همچنین در برخی نرم‌افزارهای تولید محتوا حداقل ۱۰ درصد سریع‌تر است. با در نظر گرفتن کارت‌های گرافیک جدید Radeon 9070، ترکیب این سخت‌افزارها می‌تواند یک سیستم گیمینگ پرقدرت را شکل دهد.

شرکت AMD اعلام کرد که پردازنده‌های جدید Ryzen X3D خود را در تاریخ ۱۲ مارس عرضه خواهد کرد.

این مدل‌ها شامل Ryzen 9 9950X3D و Ryzen 9 9900X3D هستند که اولین بار در نمایشگاه CES 2025 معرفی شدند و در حال حاضر قوی‌ترین پردازنده‌های گیمینگ این شرکت محسوب می‌شوند.

مدل 9950X3D دارای ۱۶ هسته‌ سی‌پی‌یوی Zen 5، فرکانس بوست ۵.۷ گیگاهرتز و فناوری نسل دوم 3D V-Cache است که عملکرد بهینه‌تری را ارائه می‌دهد. در مقابل، مدل 9900X3D با ۱۲ هسته‌ی پردازشی و حداکثر سرعت ۵.۵ گیگاهرتز عرضه می‌شود. فناوری 3D V-Cache همچنان ویژگی برجسته این پردازنده‌ها محسوب می‌شود. این شرکت 3D V-Cache را به عنوان روشی برای بسته‌بندی ماژول‌های کش روی هم معرفی کرد تا عملکردی که نیاز کمتری به RAM داشته باشد ارائه دهد. این فناوری ابتدا به پردازنده های دسکتاپ اضافه شد، تا اینکه در سال 2023 به پردازنده‌های لپ‌تاپ نیز اضافه گردید.

بنا بر اعلام AMD، مدل 9950X3D در ۴۰ بازی مختلف تا ۲۰ درصد سریع‌تر از Core i9 285K اینتل عمل می‌کند و همچنین در برخی نرم‌افزارهای تولید محتوا حداقل ۱۰ درصد سریع‌تر است. با در نظر گرفتن کارت‌های گرافیک جدید Radeon 9070، ترکیب این سخت‌افزارها می‌تواند یک سیستم گیمینگ پرقدرت را شکل دهد.

این پردازنده‌ها از ۱۲ مارس قابل سفارش خواهند بود. مدل 9950X3D با قیمت ۶۹۹ دلار و مدل 9900X3D با قیمت ۵۹۹ دلار عرضه می‌شود.

+ نوشته شده در دوشنبه بیست و هفتم اسفند ۱۴۰۳ ساعت 10:0 توسط شهرام |

سال ۲۰۵۰ به روایت هوش مصنوعی: تحولات و چالش‌ها

پیش‌بینی‌های هوش مصنوعی تصویری از جهانی با افزایش دما، بلایای طبیعی بیشتر، افزایش سطح دریاها و افزایش شهرنشینی را ترسیم می‌کنند.

هوش مصنوعی تصویری از دنیای ۳۰ سال آینده ارائه می‌دهد که بر مبنای پیشرفت‌های فناوری و تأثیرات اجتماعی-زیست‌محیطی شکل می‌گیرد.
در این چشم‌انداز، سال ۲۰۵۰ به عنوان دوره‌ای از تغییرات گسترده و تحولات عمیق مشخص می‌شود، با محوریت فناوری اطلاعات و هوش مصنوعی.

تغییرات آب‌وهوایی

تغییرات اقلیمی همچنان یکی از اصلی‌ترین چالش‌های جهان خواهد بود. پدیده‌هایی همچون افزایش شدید دما، بالا آمدن سطح دریاها و وقوع بلایای طبیعی، زندگی بشر را تحت تأثیر قرار خواهند داد. اقدامات فوری برای مقابله با این بحران اجتناب‌ناپذیر است، چراکه هرگونه تأخیر می‌تواند پیامدهای ویرانگری به همراه داشته باشد.

نابرابری اقتصادی

شکاف میان فقرا و ثروتمندان گسترش یافته و ممکن است ناآرامی‌های اجتماعی و بی‌ثباتی سیاسی را تقویت کند. سیاست‌هایی برای ترویج عدالت اقتصادی و کاهش نابرابری ضروری خواهد بود.

تحولات فناوری

پیشرفت‌های چشم‌گیر در فناوری‌هایی نظیر هوش مصنوعی و ویرایش ژن می‌توانند بهبودهایی در زندگی انسان‌ها به ارمغان آورند؛ اما در عین حال، چالش‌های جدیدی نیز مطرح خواهند کرد که نیازمند مدیریت هوشمندانه هستند.

انرژی‌های تجدیدپذیر و حمل‌ونقل

با افزایش نگرانی‌ها در مورد تغییرات اقلیمی، تمرکز بر استفاده از منابع انرژی پایدار مانند انرژی خورشیدی و بادی افزایش خواهد یافت. همچنین، حمل‌ونقل با استفاده از خودروهای خودران و پهپادها متحول می‌شود و این امر به کاهش ترافیک، بهبود ایمنی و افزایش بهره‌وری کمک خواهد کرد.

شهرنشینی و شهرهای هوشمند

بیش از دو سوم جمعیت جهان در مناطق شهری زندگی خواهند کرد. این روند منجر به توسعه شهرهایی هوشمند و متصل‌تر خواهد شد که از فناوری‌های پیشرفته برای بهبود کیفیت زندگی بهره می‌برند.

+ نوشته شده در چهارشنبه بیست و دوم اسفند ۱۴۰۳ ساعت 7:54 توسط شهرام |

گامی تازه در هوش مصنوعی با صدای انسان‌نما: فرصتی بزرگ یا تهدیدی جدی؟

نگرانی‌های بیشتری نیز در مورد پیامدهای اجتماعی و امنیتی این فناوری مطرح شده است. برخی محققان هشدار داده‌اند که این فناوری می‌تواند در حملات فیشینگ صوتی مورد سوءاستفاده قرار گیرد.

یک مدل جدید هوش مصنوعی با قابلیت تولید صدایی کاملاً شبیه به انسان، واکنش‌های متناقضی را در فضای مجازی برانگیخته است.

شرکت Sesame AI، که توسط برندان ایریب، یکی از بنیان‌گذاران Oculus، تأسیس شده، این مدل را معرفی کرده است. این فناوری که از یک مدل گفتاری چندوجهی استفاده می‌کند، توانایی پردازش هم‌زمان متن و صوت را دارد و به شکل چشمگیری به صدای واقعی انسان نزدیک شده است.

در آزمایش‌های اولیه، کاربران از کیفیت طبیعی و ظرافت‌های گفتاری این مدل، مانند صداهای تنفسی، خنده و اصلاحات خودکار، شگفت‌زده شده‌اند. اما در عین حال، برخی احساس ناراحتی کرده‌اند. برای مثال، یکی از کاربران اظهار داشت که صدای مدل زنانه مایا (Maya) شباهت عجیبی به نامزد سابقش داشته که باعث ناراحتی او شده است: «دقیقاً شبیه [اکس من] نبود، اما به اندازه کافی نزدیک به آن بود. از صحبت کردن با این هوش مصنوعی آنقدر ترسیده بودم که مجبور شدم مکالمه را ترک کنم.»

نگرانی‌های بیشتری نیز در مورد پیامدهای اجتماعی و امنیتی این فناوری مطرح شده است. برخی محققان هشدار داده‌اند که این فناوری می‌تواند در حملات فیشینگ صوتی مورد سوءاستفاده قرار گیرد. با این که مدل کنونی توانایی تقلید صدای اشخاص را ندارد، اما تکنولوژی‌های مشابه در این حوزه پیشرفت زیادی کرده‌اند و می‌توانند در آینده توسط هکرها برای کلاهبرداری و مهندسی اجتماعی مورد استفاده قرار گیرند.

همچنین، تأثیرات این فناوری بر بازار کار، به‌ویژه در حوزه خدمات مشتری و پشتیبانی فنی، مورد بحث قرار گرفته است. اگرچه سازندگان Sesame AI به محدودیت‌های فعلی مدل خود اذعان دارند، اما امیدوارند که با بهبودهای آینده، فاصله‌ی این فناوری با صدای طبیعی انسان کمتر شود.

+ نوشته شده در چهارشنبه بیست و دوم اسفند ۱۴۰۳ ساعت 7:52 توسط شهرام |

ویدئویی از Unitree G1 کونگ‌فوکار!

این ربات چینی می‌تواند حرکات کونگ‌فو را انجام دهد!

بات Unitree G1، یک ربات چهارپا است که توسط شرکت چینی Unitree Robotics طراحی و تولید شده است. این ربات به دلیل طراحی پیشرفته‌، قابلیت‌های حرکتی متنوعی دارد و می‌تواند به راحتی در محیط‌های مختلف جابجا شود. واحد حرکتی این ربات به آن امکان می‌دهد تا در زمین‌های دشوار و ناهموار به خوبی عمل کند و در کاربردهای گوناگونی نظیر کاوش، نظارت و خدمات رسانی به کار گرفته شود.

مدل G1 به فناوری‌های پیشرفته‌ای در زمینه حسگرها و هوش مصنوعی مجهز است که به آن اجازه می‌دهد تا زمان واقعی، محیط اطراف خود را تحلیل کرده و تصمیمات بهینه‌ای را اتخاذ کند. این ویژگی‌ها آن را به یک ابزار ایده‌آل برای تحقیقات علمی، آموزش و توسعه فناوری‌های رباتیک تبدیل کرده است. توانایی این ربات در انجام حرکات پیچیده و هماهنگ، نشان‌دهنده دقت و قدرت مهندسی در طراحی آن است.

+ نوشته شده در دوشنبه بیستم اسفند ۱۴۰۳ ساعت 12:16 توسط شهرام |

بازوی رباتیک مجهز به هوش مصنوعی با فکرخوانی به افراد فلج کمک ‌می‌کند

یک گروه پژوهشگر دانشگاه کالیفرنیا در ایالات متحده با انتشار مقاله‌ای در مجله علمی پژوهشی «Cell» از ساخت بازوی رباتیک خبر دادند که قادر است با خواندن افکار افراد فلج به آن‌ها خدمت‌رسانی کرده و مانند یک بازوی سوم عمل کند.

یکی از داوطلبان شرکت در آزمایش‌های ساخت این بازو می‌تواند به بازو دستور دهد کابینت را باز کرده، لیوانی بر دارد و پر از آب کند. ربات پشت صندلی این داوطلب نصب شده است و از طریق خوانش سیگنال‌های مغزی او می‌تواند از فرمان‌ها پیروی کند.

این مرد داوطلب که در دهه چهل زندگی خود به سر‌می‌برد، به دلیل سکته مغزی شدید، دچار فلج کل بدن است. او امیدوار است با پیشرفت این فناوری در سال‌های آینده کیفیت زندگی خود را بهبود دهد.

مغز او با تصور اینکه خود این کار را انجام می‌دهد، سیگنال‌هایی را از حسگرهای نصب شده بر روی مغزش به بازوی رباتیک ارسال می‌کند.

کارونش گانگولی، استادیار عصب‌شناسی در دانشگاه کالیفرنیا و محقق اصلی این پروژه می‌گوید اولویت این مطالعه، کمک به افرادی است که دچار فلج کل بدن هستند. او توضیح می‌دهد: «از منظر عصب‌شناسی، تتراپلژی به معنای فقدان حرکت است. این بیماران برخی انقباضات را دارند، اما این انقباضات کاربرد عملی ندارد. در واقع، آن‌ها از نظر ناتوانی عملکردی به گونه‌ای هستند که به مراقبت ۲۴ ساعته احتیاج دارند..»

گانگولی تصریح می‌کند که حسگرها به داخل مغز نفوذ نمی‌کنند و توضیح می‌دهد: «شبکه‌ای که بر سطح مغز قرار دارد، از نواحی حرکتی به نواحی مرتبط با گفتار متصل است. این شبکه به ما اجازه می‌دهد تا فعالیت مغز بیمار را در حین فکر کردن به حرکت، اندازه‌گیری و ثبت کنیم.»

وی ادامه می‌دهد: «حسگرها ابتدا اعمال ذهنی بیمار را کالیبره می‌کنند، به این معنی که از او خواسته می‌شود تا حرکاتی مانند حرکت مچ دست، شست، دست و بازو را در ذهن خود تصور کند. سپس ما نقشه‌ای از اعمال تخیلی او ترسیم می‌کنیم.»

سیستم هوش مصنوعی به کار گرفته‌شده این سیگنال‌ها را تفسیر کرده و به می‌آموزد که بازوی رباتیک چگونه باید حرکت کند. هر بار که بیمار یک عمل ذهنی را انجام می‌دهد، سیستم هوش مصنوعی یاد می‌گیرد و از اطلاعات قبلی برای بهبود عملکرد در دفعات بعدی استفاده می‌کند.

گانگولی می‌گوید: «این به ما این امکان را می‌دهد که با استفاده از الگوریتم‌های هوش مصنوعی، یادگیری مغز را در چند روز ردیابی کرده و برای ماه‌ها عملکردی پایدار داشته باشیم. بنابراین، با پنج یا شش روز تمرین، هوش مصنوعی به درستی نحوه یادگیری مغز را تشخیص می‌دهد و هنگامی که به تثبیت رسید، عملکرد برای مدت طولانی پایدار می‌ماند.»

این نوع سیستم در حال حاضر به مثابه رابط‌های کامپیوتری مغز و هوش مصنوعی، توسط دانشمندان دانشگاه کالیفرنیا برای کمک به بیماران ناتوان از سخنگویی نیز مورد استفاده قرار می‌گیرد.

بازوی رباتیک مورد استفاده در این تحقیق، تاییدیه سازمان غذا و داروی ایالات متحده را دریافت کرده است، اما هنوز نسبتاً سنگین است و استفاده از آن دشواری‌هایی دارد. گانگولی امیدوار است که در آینده نزدیک، نسخه‌ای سبک‌تر و راحت‌تر از این فناوری تولید شود.

او می‌گوید: «در حال حاضر، این فناوری به افرادی که دچار آسیب‌های شدید شده‌اند، کمک می‌کند، اما در آینده این دستاورد می‌تواند به بیمارانی با اختلالات بیشتر و شایع‌تر گسترش یابد.»

این مطالعه به بررسی چگونگی توانمندسازی بیماران برای انجام فعالیت‌های خاص پرداخت، اما گانگولی و تیم تحقیقاتی او می‌گویند که بیمار آزمایشی در حال تلاش برای گسترش دامنه حرکات خود است.

این پژوهشگر توضیح می‌دهد: «باز کردن کابینت‌ها برای برداشتن لیوان و نوشیدن آب یکی از این حرکات است. این کار به بیمار این امکان را می‌دهد که خود به دستاوردهایی برسد، به جای آنکه مجبور باشد دکمه‌ای را فشار دهد و منتظر کسی باشد. این احساس استقلال بسیار مهم است و ما به این سمت پیش می‌رویم.»

با پیشرفت سریع دو علم عصب‌شناسی و هوش مصنوعی، در ماه مه ۲۰۲۳، پزشکان سوئیسی با استفاده از ایمپلنت مغزی آزمایشی به مردی که بر اثر حادثه دوچرخه‌سوازی فلج شده بودند، اجازه دادند تا دوباره چند قدمی بردارد. این دانشمندان دانشگاه لوزان توانستند ارتباط بی‌سیمی بین ستون فقرات آسیب‌دیده و مغز او برقرار کنند و در نتیجه وی توانست پس از ۱۲ سال، راه رفته و حتی از پله‌ها بالا برود.

همچنین پزشکان سوئیسی در آزمایشی دیگر نشان دادند که چگونه دستگاهی که پالس‌های الکترونیکی به ستون فقرات می‌فرستد، به یک بیمار دچار پارکینسون اجازه دادند که برای اولین بار پس از سال‌ها بدون کمک راه برود.

+ نوشته شده در دوشنبه بیستم اسفند ۱۴۰۳ ساعت 11:44 توسط شهرام |

آزمایش دوبله مبتنی بر هوش مصنوعی در پرایم ویدئو

آمازون تنها شرکتی نیست که از هوش مصنوعی برای بهبود محتوای ویدیویی استفاده می‌کند. یوتیوب در سال ۲۰۲۴ ابزاری معرفی کرد که به تولیدکنندگان محتوا امکان می‌دهد ویدئوهای خود را به‌صورت خودکار به زبان‌های دیگر دوبله کنند. همچنین، متا برنامه‌ای برای دوبله و همگام‌سازی لب ویدئوهای کوتاه در اینستاگرام ریلز دارد.

آمازون اعلام کرده است که در حال آزمایش یک سیستم دوبله مبتنی بر هوش مصنوعی برای برخی از فیلم‌ها و سریال‌های منتخب در سرویس استریم پرایم ویدئو است.

این سیستم که از روش «دوبله با کمک هوش مصنوعی» استفاده می‌کند، در حال حاضر برای ۱۲ فیلم و سریال دارای مجوز، از جمله El Cid: La Leyenda، Mi Mamá Lora و Long Lost در دو زبان انگلیسی و اسپانیایی آمریکای لاتین در دسترس خواهد بود.

برخلاف دوبله تماماً مبتنی بر هوش مصنوعی، آمازون از رویکرد ترکیبی بهره می‌برد، به این معنا که ابتدا هوش مصنوعی نسخه اولیه‌ای از دوبله را تولید می‌کند و سپس متخصصان بومی‌سازی، آن را ویرایش و بهبود می‌بخشند. این فرآیند می‌تواند زمان و هزینه تولید دوبله را کاهش داده و محتوای بیشتری را برای کاربران در سراسر جهان قابل‌دسترس کند.

صنعت زیرنویس و دوبله در حال رشد است، به‌ویژه با افزایش تولید و پخش جهانی فیلم‌ها و سریال‌ها در پلتفرم‌های استریم. با این حال، دوبله سنتی معمولاً توسط بازیگران حرفه‌ای انجام می‌شود و هنوز مشخص نیست که آیا مخاطبان به راحتی صدای تولید شده توسط هوش مصنوعی را به جای صدای واقعی انسان خواهند پذیرفت یا خیر.

آمازون تنها شرکتی نیست که از هوش مصنوعی برای بهبود محتوای ویدیویی استفاده می‌کند. یوتیوب در سال ۲۰۲۴ ابزاری معرفی کرد که به تولیدکنندگان محتوا امکان می‌دهد ویدئوهای خود را به‌صورت خودکار به زبان‌های دیگر دوبله کنند. همچنین، متا برنامه‌ای برای دوبله و همگام‌سازی لب ویدئوهای کوتاه در اینستاگرام ریلز دارد. این روند نشان می‌دهد که استفاده از هوش مصنوعی در دوبله، به‌تدریج به یک استاندارد در صنعت رسانه تبدیل خواهد شد.

+ نوشته شده در دوشنبه بیستم اسفند ۱۴۰۳ ساعت 11:41 توسط شهرام |

معرفی «دراگون کوپایلوت»؛ نخستین دستیار صوتی هوش مصنوعی برای پزشکان

شرکت مایکروسافت به‌تازگی از دستیار صوتی هوش مصنوعی جدیدی به نام «دراگون کوپایلوت» رونمایی کرده است که به‌عنوان نخستین دستیار صوتی یکپارچه در صنعت بهداشت و درمان معرفی می‌شود.

این ابزار با ترکیب قابلیت‌های اثبات‌شده «دراگون مدیکال وان» و «دکس کوپایلوت»، به پزشکان کمک می‌کند تا مستندسازی‌های بالینی را ساده‌تر کرده، اطلاعات مورد نیاز را به‌سرعت پیدا کنند و وظایف تکراری را خودکارسازی نمایند.

قابلیت‌های کلیدی دراگون کوپایلوت
دراگون کوپایلوت با بهره‌گیری از فناوری پیشرفته تشخیص گفتار و هوش مصنوعی مولد، امکانات متعددی را در اختیار پزشکان قرار می‌دهد:

مستندسازی بالینی خودکار: این دستیار صوتی می‌تواند مکالمات بین پزشک و بیمار را به‌صورت خودکار ضبط و به متن تبدیل کند، که این امر به کاهش زمان صرف‌شده برای نوشتن گزارش‌های پزشکی منجر می‌شود.
دسترسی سریع به اطلاعات: با استفاده از فرمان‌های صوتی، پزشکان می‌توانند به‌سرعت به اطلاعات پزشکی بیماران، نتایج آزمایش‌ها و سوابق درمانی بدون نیاز به جستجوی دستی در سیستم‌های مختلف دسترسی پیدا کنند.
خودکارسازی وظایف تکراری: دراگون کوپایلوت قادر است وظایف تکراری مانند تنظیم قرار ملاقات‌ها، ارسال یادآوری‌ها و تهیه نسخه‌ها را به‌صورت خودکار انجام دهد، که این امر به بهبود کارایی و کاهش خطاهای انسانی کمک می‌کند.

مزایای استفاده از دراگون کوپایلوت در بهداشت و درمان
طبق اطلاعات منتشر شده، استفاده از دراگون کوپایلوت می‌تواند تاثیرات مثبتی در حوزه بهداشت و درمان داشته باشد:

افزایش رضایت پزشکان: با کاهش بار کاری مرتبط با مستندسازی و وظایف اداری، پزشکان می‌توانند زمان بیشتری را به مراقبت از بیماران اختصاص دهند، که این امر به بهبود رضایت شغلی آن‌ها منجر می‌شود.
بهبود تجربه بیماران: با دسترسی سریع‌تر به اطلاعات و کاهش زمان انتظار، بیماران تجربه بهتری از خدمات پزشکی خواهند داشت.
کاهش هزینه‌ها: خودکارسازی فرآیندها و کاهش خطاهای انسانی می‌تواند به کاهش هزینه‌های عملیاتی در مراکز بهداشتی منجر شود.

چالش‌ها و ملاحظات پیاده‌سازی
با وجود مزایای متعدد، پیاده‌سازی دراگون کوپایلوت نیازمند توجه به برخی چالش‌ها و ملاحظات است:

حفظ حریم خصوصی بیماران: با توجه به اینکه این ابزار مکالمات پزشکی را ضبط می‌کند، اطمینان از حفاظت داده‌های حساس بیماران ضروری است.
آموزش و پذیرش توسط کارکنان پزشکی: برای بهره‌برداری کامل از قابلیت‌های دراگون کوپایلوت، آموزش مناسب به پزشکان و کارکنان پزشکی لازم است تا با نحوه استفاده صحیح از این فناوری آشنا شوند.
هماهنگی با سیستم‌های موجود: ادغام دراگون کوپایلوت با سیستم‌های اطلاعاتی موجود در مراکز بهداشتی ممکن است نیازمند تنظیمات و هماهنگی‌های فنی باشد.

هوش مصنوعی با وجود رشد سریع و تصاعدی خود در تمامی زمینه‌ها، کماکان با چالش یادگیری ماشین، نیازمندی‌های سخت‌افزاری و همچنین چالش‌های حقوقی و اخلاقی روبرو است. دراگون کوپایلوت نیز مانند هوش‌های مصنوعی مشابه، به‌عنوان یک دستیار صوتی هوش مصنوعی، پتانسیل بالایی برای تحول در فرآیندهای بهداشت و درمان دارد و با تسهیل مستندسازی، دسترسی سریع به اطلاعات و خودکارسازی وظایف تکراری، این ابزار می‌تواند به بهبود کارایی، رضایت پزشکان و تجربه بیماران کمک کند. با این حال، موفقیت در پیاده‌سازی آن نیازمند توجه به ملاحظات امنیتی، آموزش مناسب و هماهنگی با زیرساخت‌های موجود است.

+ نوشته شده در شنبه هجدهم اسفند ۱۴۰۳ ساعت 8:3 توسط شهرام |

انقلاب جدید در رایانش کوانتومی با استفاده از فیبر نوری

رایانش کوانتومی با اتصال کیوبیت‌ها از طریق فیبر نوری گام بزرگی به جلو برداشته و امکان توسعه سامانهٔ کوانتومی در مقیاس بزرگ و شبکه‌ای را فراهم کرده است.

در یک پیشرفت مهم، فیزیکدانان مؤسسه علم و فناوری اتریش (ISTA) توانسته‌اند یک روش خوانش کاملاً نوری برای کیوبیت‌های ابررسانا توسعه دهند و یک مانع فناورانه کلیدی را پشت سر بگذارند.

یافته‌های آن‌ها که اخیراً در مجله Nature Physics منتشر شده، می‌تواند راه را برای توسعه سامانه‌های رایانش کوانتومی کارآمدتر و مقیاس‌پذیرتر هموار کند.

باوجود نوسانات بازار و تردیدهای صنعت، رقابت برای ساخت رایانه‌های کوانتومی مقیاس‌پذیر همچنان شدت دارد. این ماشین‌ها می‌توانند در برخی محاسبات از رایانه‌های کلاسیک پیشی بگیرند، اما چالش‌های فنی بسیاری باید برطرف شوند تا این فناوری به مرحله عملی برسد.

اکنون تیمی از فیزیکدانان گروه پروفسور یوهانس فینک در ISTA گامی اساسی در جهت عملی‌تر شدن رایانش کوانتومی برداشته‌اند. آن‌ها روشی را توسعه داده‌اند که کیوبیت‌ها می‌توانند با استفاده از فیبر نوری ارتباط برقرار کنند، که نیاز به سخت‌افزار حجیم کرایوژنیک را به‌شدت کاهش می‌دهد.

گئورگ آرنولد، یکی از نویسندگان اصلی مقاله، می‌گوید: «این رویکرد جدید ممکن است امکان افزایش تعداد کیوبیت‌ها را فراهم کند تا رایانه‌های کوانتومی واقعاً به کار گرفته شوند.» همچنین این روش پایه‌ای برای ایجاد شبکه‌ای از رایانه‌های کوانتومی ابررسانا که با فیبر نوری در دمای اتاق متصل می‌شوند، فراهم می‌کند.

گفتنی است با اینکه فیبر نوری صنعت مخابرات را متحول کرده و ارتباطات پرسرعت را امکان‌پذیر ساخته، اما استفاده از آن در سخت‌افزار کوانتومی کار ساده‌ای نیست.

برای کارکرد کیوبیت‌های ابررسانا، مدارهای الکتریکی کوچک باید به دماهای بسیار پایین، تنها چند هزارم درجه بالاتر از صفر مطلق، برسند تا مقاومت الکتریکی آن‌ها به صفر کاهش یابد و جریان الکتریکی به‌طور نامحدود حفظ شود.

آرنولد می‌گوید: «از آنجایی که کیوبیت‌های ابررسانا ذاتاً الکتریکی هستند، برای ساخت آن‌ها باید به دماهایی برسیم که حتی از فضای بیرونی هم سردتر است.»

برای دستیابی به خوانش کاملاً نوری در سخت‌افزار کوانتومی، تیم تحقیقاتی باید راهی برای تبدیل سیگنال نوری به زبان قابل‌فهم برای کیوبیت‌ها پیدا می‌کردند.

توماس ورنر، از اعضای تیم تحقیقاتی، توضیح می‌دهد: «در حالت ایده‌آل، ما دوست داریم همه سیگنال‌های الکتریکی را حذف کنیم، زیرا سیم‌کشی‌های لازم برای ارسال این سیگنال‌ها مقدار زیادی گرما را به محفظه‌های خنک‌کننده منتقل می‌کنند. اما این کار امکان‌پذیر نیست.»

به همین دلیل، محققان از یک مبدل الکترواپتیکی برای تبدیل سیگنال نوری به فرکانس مایکروویو (سیگنال الکتریکی قابل‌فهم برای کیوبیت‌ها) استفاده کردند. سپس، کیوبیت‌ها سیگنال مایکروویو را بازتاب می‌کنند و این سیگنال مجدداً توسط مبدل به سیگنال نوری تبدیل می‌شود.

ورنر می‌افزاید: «ما نشان دادیم که می‌توان نور مادون‌قرمز را به کیوبیت‌ها نزدیک کرد بدون اینکه آن‌ها خاصیت ابررسانایی خود را از دست بدهند.»

برای انجام رایانش مفید با رایانه‌های کوانتومی، به هزاران یا حتی میلیون‌ها کیوبیت نیاز است. اما زیرساخت‌های کنونی قادر به پشتیبانی از چنین مقیاسی نیستند، زیرا نیازهای سرمایشی برای تشخیص و اندازه‌گیری کیوبیت‌ها بسیار پرهزینه است.

آرنولد می‌گوید: «فناوری ما می‌تواند بار حرارتی خوانش کیوبیت‌های ابررسانا را به میزان قابل‌توجهی کاهش دهد و امکان افزایش تعداد کیوبیت‌های قابل استفاده را فراهم کند».

گفته می‌شود این روش همچنین بسیاری از اجزای الکتریکی دست‌وپاگیر را حذف کرده و باعث افزایش کارایی و کاهش هزینه‌های سیستم شده است. ورنر توضیح می‌دهد: «با استفاده از مبدل الکترواپتیکی برای قطع ارتباط کیوبیت‌ها از زیرساخت الکتریکی، توانستیم تمام بخش‌های باقی‌مانده را با اجزای نوری جایگزین کنیم».

این فناوری می‌تواند تعداد کیوبیت‌های قابل‌استفاده را بیشتر کند و همچنین امکان اتصال چندین رایانه کوانتومی از طریق نور را فراهم سازد.

در حال حاضر، رایانه‌های کوانتومی به یخچال‌های رقیق‌ساز برای خنک‌سازی کل مجموعه اندازه‌گیری نیاز دارند. اما این یخچال‌ها محدودیت‌های فیزیکی دارند و نمی‌توان آن‌ها را بی‌نهایت بزرگ کرد.

+ نوشته شده در شنبه هجدهم اسفند ۱۴۰۳ ساعت 8:1 توسط شهرام |

اوپن اِی‌آی (OpenAI) ابزار تولید ویدیوی Sora را به چت‌جی‌پی‌تی اضافه می‌کند

در حال حاضر، سورا به‌عنوان یک اپلیکیشن وب مستقل در دسترس است و به کاربران اجازه می‌دهد تا از طریق ورودی‌های متنی، کلیپ‌های ویدیویی تا 20 ثانیه ایجاد کنند.

اوپن اِی‌آی در حال برنامه‌ریزی برای ادغام ابزار تولید ویدیوی هوش مصنوعی خود به نام سورا (Sora) در اپلیکیشن چت‌بات محبوب چت‌جی‌پی‌تی است. این ادغام به کاربران امکان می‌دهد تا بدون نیاز به تغییر پلتفرم، ویدیوهای خود را به‌صورت مستقیم در گفتگوها تولید کنند.

در حال حاضر، سورا به‌عنوان یک اپلیکیشن وب مستقل در دسترس است و به کاربران اجازه می‌دهد تا از طریق ورودی‌های متنی، کلیپ‌های ویدیویی تا 20 ثانیه ایجاد کنند.

مزایا و محدودیت‌ها

این ادغام می‌تواند فرآیند تولید محتوا را برای کاربران ساده‌تر کند، اما ممکن است نسخه ادغام‌شده در چت‌جی‌پی‌تی دارای ابزارهای ویرایش محدودتری نسبت به اپلیکیشن مستقل سورا باشد. این تصمیم برای حفظ رابط کاربری ساده چت‌جی‌پی‌تی گرفته شده است.

توسعه‌های آینده

اوپن اِی‌آی همچنین در حال توسعه یک اپلیکیشن موبایل مستقل برای سورا است و به دنبال استخدام مهندسان موبایل برای این پروژه است. علاوه بر این، در حال کار بر روی یک ژنراتور تصویر جدید با استفاده از سورا است که می‌تواند تصاویر واقع‌گرایانه‌تر ایجاد کند. در حال حاضر، چت‌جی‌پی‌تی از مدل DALL-E 3 برای تولید تصویر پشتیبانی می‌کند.

تأثیر بر کاربران

این ادغام می‌تواند کاربران را به سمت اشتراک‌های پریمیوم چت‌جی‌پی‌تی سوق دهد، زیرا محدودیت‌های تولید ویدیو در اشتراک‌های پایه وجود دارد. اوپن اِی‌آی با این حرکت قصد دارد تا جذب کاربران را افزایش دهد و تجربه کاربری را برای تولید محتوای ویدیویی بهبود بخشد.

+ نوشته شده در سه شنبه چهاردهم اسفند ۱۴۰۳ ساعت 7:59 توسط شهرام |

چرا شرکت‌ها به سمت مدل‌های کوچک هوش مصنوعی روی آورده‌اند؟

گوگل، مایکروسافت و OpenAI نیز در کنار مدل‌های بزرگ، نسخه‌های کوچک‌تری مانند Gemma، Phi-4 و o3-mini را برای پاسخگویی به نیازهای خاص کسب‌وکارها ارائه کرده‌اند.

در حالی که مدل‌های زبانی بزرگ (LLMها) به دلیل دانش گسترده و توانایی حل مسائل پیچیده محبوبیت زیادی پیدا کرده‌اند، مدل‌های کوچک‌تر در حال جلب توجه بیشتر کسب‌وکارها هستند.
دلایل اصلی این تغییر رویکرد شامل کاهش هزینه‌های پردازشی، بهبود کارایی و جلوگیری از خطاهای مدل‌های بزرگ است. طبق بررسی‌های Forrester، استفاده از مدل‌های زبانی کوچک (SLMها) در سال جاری بیش از ۶۰٪ رشد خواهد داشت.

تعریف مدل‌های کوچک؛ پارامترها و روش توسعه
مدل‌های کوچک زبان معمولاً بین چند میلیون تا ۱۰ میلیارد پارامتر دارند، در حالی که مدل‌های بزرگ صدها میلیارد تا تریلیون‌ها پارامتر دارند. برخی شرکت‌ها نیز این مدل‌ها را بر اساس روش توسعه مانند تقلیل (Distillation) تعریف می‌کنند.

گوگل، مایکروسافت و OpenAI نیز در کنار مدل‌های بزرگ، نسخه‌های کوچک‌تری مانند Gemma، Phi-4 و o3-mini را برای پاسخگویی به نیازهای خاص کسب‌وکارها ارائه کرده‌اند.

جذابیت مدل‌های کوچک برای کسب‌وکارها
مدل‌های کوچک‌تر کارایی بهتری در حوزه‌های تخصصی مانند پزشکی و صنایع خاص دارند و از آنجا که قدرت پردازش کمتری نیاز دارند، هزینه‌های عملیاتی را کاهش می‌دهند. همچنین، این مدل‌ها در فضای ابری، پردازش داخلی (On-premise) و حتی روی دستگاه‌های شخصی مقرون‌به‌صرفه‌تر هستند.

طبق گزارش Civo، بیش از یک‌سوم شرکت‌ها پروژه‌های هوش مصنوعی را به دلیل هزینه‌های بالا و محدودیت‌های رایانشی به تعویق انداخته‌اند. مدل‌های کوچک می‌توانند به حفظ امنیت داده‌ها و حریم خصوصی نیز کمک کنند، زیرا امکان اجرای آنها روی فضاهای ابری خصوصی یا سرورهای داخلی وجود دارد.

مدل‌های کوچک، جایگزین مدل‌های بزرگ نیستند
با وجود مزایای مدل‌های کوچک، آن‌ها توانایی پوشش طیف گسترده‌ای از وظایف مدل‌های بزرگ را ندارند. به گفته تحلیلگران، مدل‌های بزرگ مانند لاما، GPT-4 و دیپ‌سیک همچنان برای وظایف کلی‌تر و پردازش زبان پیچیده‌تر بهتر عمل می‌کنند.

جمع‌بندی
در نهایت، مدل‌های کوچک و بزرگ مکمل یکدیگر هستند. کسب‌وکارها باید بسته به نیازهای خاص خود، هزینه‌ها و ملاحظات امنیتی، مدل مناسب را انتخاب کنند تا بهترین عملکرد را از هوش مصنوعی دریافت کنند.

+ نوشته شده در دوشنبه سیزدهم اسفند ۱۴۰۳ ساعت 8:3 توسط شهرام |

کابل‌های مرگبار: امنیت آنلاین در خطر

این کابل شارژ اصلاح‌شده ممکن است بی‌ضرر به نظر برسد، اما وقتی در دست افراد جنایتکار قرار می‌گیرد، می‌تواند به رایانه شما نفوذ کند. این سیم اصلاح‌شده دارای یک برد مدار چاپی است که به هکرها اجازه می‌دهد به‌راحتی هر سیستمی را با اتصال به هر دستگاه متصل، هک کند.

امروزه در سال ۲۰۲۵، حفظ امنیت آنلاین از همیشه دشوارتر شده است، اما نکته نگران‌کننده این است که هکرها برای دسترسی به زندگی خصوصی افراد، به ابزارهای پیشرفته یا ابررایانه نیاز ندارند. روشی جدید ظهور کرده است که هکرها با استفاده از یک سیم ساده می‌توانند به فایل‌های شما دسترسی پیدا کنند.

این کابل شارژ اصلاح‌شده ممکن است بی‌ضرر به نظر برسد، اما وقتی در دست افراد جنایتکار قرار می‌گیرد، می‌تواند به رایانه شما نفوذ کند. این سیم اصلاح‌شده دارای یک برد مدار چاپی است که به هکرها اجازه می‌دهد به‌راحتی هر سیستمی را با اتصال به هر دستگاه متصل، هک کند.

این کابل‌ها می‌توانند به‌صورت USB، USB-C و حتی کابل‌های مخصوص آیفون عرضه شوند. سیم اصلاح‌شده قادر است ضربات کلید را ضبط کند، کنترل دستگاه را از راه دور به دست گیرد و هر کاری را انجام دهد، درست مانند اینکه هکر پشت کامپیوتر یا صفحه کلید نشسته باشد، خواه این کار نصب بدافزار باشد یا هر چیز دیگر.
راه‌های حفاظت: برای محافظت از خود در برابر این نوع حمله، باید از کابل‌های اصلی دستگاه‌ها استفاده کنید و از کابل‌های عمومی استفاده نکنید. توجه داشته باشید که باید کابل‌های خود را از فروشندگان مجاز خریداری کنید و اطمینان حاصل کنید که نرم‌افزارهای ضدبدافزار قدرتمند روی دستگاه‌ها نصب شده باشند.

همچنین بسیار مهم است که از کابلی که در مکان‌های عمومی یا مثلاً در یک کافه پیدا کرده‌اید، استفاده نکنید. هکرها می‌توانند این کابل‌های اصلاح‌شده را در مکان‌های عمومی رها کنند به امید اینکه کسی آنها را برداشته و با دستگاه‌های خود استفاده کند، این یکی از راه‌های مورد استفاده برای گرفتن قربانیان است.

+ نوشته شده در دوشنبه سیزدهم اسفند ۱۴۰۳ ساعت 8:0 توسط شهرام |

سیستم جدید هوش مصنوعی گوگل می‌تواند اکتشاف‌های علمی بزرگ انجام دهد

گوگل از سیستمی جدید به نام «کو‌-ساینتیست»‌(Co-Scientist) رونمایی کرده است که می‌گوید می‌تواند به کشفیات علمی بزرگ و جدید منجر شود.

این ابزار هوش مصنوعی با استفاده از فناوری‌هایی مشابه مدل‌های زبانی بزرگ مبتنی بر چت مانند «جمنای» (Gemini) خود گوگل و رقبایی مانند «چت‌جی‌پی‌تی» (ChatGPT) کار می‌کند، اما به طور ویژه به یافتن دستاوردهای جدید تحقیقاتی اختصاص داده شده است.

دانشمندانی که از این سیستم استفاده کرده‌اند، آن را چیزی شبیه به داشتن همکاری بسیار آگاه و مفید توصیف می‌کنند. این سیستم را تاکنون پژوهشگران امپریال کالج لندن استفاده کرده‌ و توانسته‌اند کارهای تحقیقاتی خود را بسیار سریع‌تر از زمانی که بدون این سیستم انجام می‌دادند، بازتولید کنند.

یک دانشمند متخصص برای استفاده از این سیستم، از زبان عادی برای ارائه هدف پژوهشی استفاده می‌کند. این سیستم در ادامه، منابع و مقالات علمی منتشرشده را بررسی و آن‌ها را جمع‌بندی می‌کند، در عین حال می‌تواند یافته‌های خود را هم بررسی کند و فرضیه‌های جدید و آزمایش‌های احتمالی را که ممکن است آن‌ها را تایید کنند، پیشنهاد دهد و همه این‌ها را در حالی ارائه کند که به منابع علمی ارجاع داده است و درباره پیشنهادهایش توضیحاتی می‌دهد.

گوگل اعلام کرده که این سیستم به‌طور خاص برای همکاری طراحی شده است، نه برای خودکارسازی کامل پژوهش از طریق هوش مصنوعی. دانشمندان می‌توانند با این سیستم گفتگو کنند، بازخورد ارائه دهند و درک آن را تغییر دهند که این امر ممکن است به مرور زمان باعث بهبود آن شود.

این شرکت مجموعه‌ای از روش‌های مختلف را برای ارزیابی این سیستم به کار گرفت، از جمله اینکه از متخصصان خواست ۱۵ «هدف پژوهشی چالش‌برانگیز و باز در حوزه تخصصی خود» ارائه دهند و از کو‌ــ‌ساینتیست بخواهند راه‌حل‌های احتمالی برای آن‌ها تولید کند. آن متخصصان این ابزار جدید را بالاتر و سرتر از سایر ابزارهای موجود ارزیابی کردند.

دانشمندان حدس زدند که این سیستم می‌تواند روشی جدید برای سرعت بخشیدن به ایجاد فرضیه‌های نو و دستیابی به پیشرفت‌های جدید در طیف وسیعی از موضوعات مهم باشد. برای مثال، این سیستم پیش از این برای پژوهش درباره مقاومت ضدمیکروبی استفاده شده است؛ موضوعی که سازمان بهداشت جهانی آن را یکی از بزرگ‌ترین تهدیدها برای سلامت و ایمنی جهانی می‌داند.

خوزه پنادس که سرپرستی مشترک این کار آزمایشی را در بخش بیماری‌های عفونی امپریال [کالج لندن] بر عهده داشت، گفت: «علم آزمایشگاهی منابع زیادی مصرف می‌کند و با در نظر گرفتن چالش‌های جهانی مانند مقاومت ضدمیکروبی که در حال افزایش است، واضح است که باید با منابع کمتر، کارهای بیشتری انجام دهیم و روند کشف‌های جدید را تسریع کنیم.»

«وقتی تیم پژوهشی گوگل به ما مراجعه کرد تا پلتفرم هوش مصنوعی خود را آزمایش کنیم، متوجه شدیم که باید همان سوالات علمی‌ را که پیش از این خودمان بررسی کرده بودیم و مبنای کارهای آزمایشی ما قرار گرفته بودند، به این سیستم واگذار کنیم.»

«این عملا به این معنا بود که الگوریتم توانست شواهد موجود را بررسی کند، احتمالات را تحلیل کند، سوالاتی مطرح کند، آزمایش‌هایی طراحی کند و دقیقا همان فرضیه‌ای را پیشنهاد دهد که ما پس از سال‌ها پژوهش علمی طاقت‌فرسا به آن دست یافته بودیم، اما [این سیستم] در کسری از زمان [این کار را انجام داد].»

«این نوع پلتفرم هوش مصنوعی کو‌ــ‌ساینتیست هنوز در مراحل اولیه است، اما ما هم‌اکنون می‌بینیم که چگونه می‌تواند توان علم را به‌طور چشمگیری افزایش دهد.»

پروفسور پنادس گفت که این سیستم «ترسناک» است، زیرا نمی‌توان دقیقا دانست که چگونه ممکن است تکامل پیدا کند. برای مثال، اگرچه این سیستم نمی‌تواند بلاواسطه و یکسره کار یک دانشمند را انجام دهد، ممکن است در نهایت بخشی از کارهای آنان را خودکار کند.

گوگل در اطلاعیه‌اش اعلام کرد که این نوآوری «پرسش‌های متعددی را مطرح می‌کند»، از جمله اینکه دانشمندان چگونه می‌توانند فرضیه‌های متعدد آن را به‌سرعت ارزیابی کنند، همچنین چگونه باید مشارکت این سیستم در پژوهش‌ها را ثبت کرد و این نوآوری چگونه مسائل عملی را تغییر خواهد داد؛ مسائلی از این دست که چه کسی به‌عنوان صاحب اعتبار پژوهش شناخته می‌شود و چگونه می‌توان برای دریافت بودجه اقدام کرد. گوگل همچنین درباره نحوه اطمینان از حفظ خلاقیت در پژوهش‌های علمی ابراز نگرانی‌ کرد و گفت که کو‌ــساینتیست به ایجاد سوالاتی درباره «حفظ تنوع [فرضیه‌ها] و کشف‌های تصادفی در تولید فرضیه‌ها» دامن زده است.

اما دانشمندان گفتند که این سیستم همچنین می‌تواند راه‌های کاملا جدیدی برای پاسخ به سوالات فوری ارائه دهد که پژوهشگران در حال حاضر به‌سرعت در تلاش برای یافتن پاسخ آن‌ها هستند.

مری رایان، معاون پژوهش و کارآفرینی در امپریال [ کالج لندن]، گفت: «جهان با چالش‌های پیچیده متعددی روبرو است‌ــ از همه‌گیری‌ها گرفته تا پایداری محیط‌‌زیست و امنیت غذایی. برای پاسخ به این نیازهای فوری، باید فرایندهای سنتی تحقیق و توسعه را تسریع کرد و هوش مصنوعی به طور فزاینده‌ای از اکتشاف‌های علمی و پیشرفت‌های نوآورانه پشتیبانی خواهد کرد.»

گوگل در حال حاضر، این سیستم را تنها از طریق یک «برنامه آزمایش‌کنندگان مورداعتماد» در دسترس قرار می‌دهد که هدف آن اطمینان از این است که افرادی مسئول از این سیستم استفاده می‌کنند. پژوهشگران می‌توانند از طریق گوگل به این برنامه بپیوندند.

+ نوشته شده در شنبه یازدهم اسفند ۱۴۰۳ ساعت 8:39 توسط شهرام |

ادوبی فتوشاپ را به موبایل آورد

یکی از جذاب‌ترین ویژگی‌های فتوشاپ موبایل، استفاده از هوش مصنوعی Firefly است که امکان Generative Fill و Generative Expand را فراهم می‌کند. کاربران می‌توانند به‌راحتی بخش‌هایی به تصویر اضافه کنند یا قاب آن را گسترش دهند. همچنین، قابلیت تولید تصویر از ابتدا با Firefly نیز در دسترس خواهد بود.

ادوبی سرانجام نسخه‌ موبایلی فتوشاپ را معرفی کرد. این اپلیکیشن که از ۲۵ فوریه ۲۰۲۵ برای آیفون در دسترس است و نسخه‌ اندروید آن اواخر امسال منتشر می‌شود، به کاربران امکان می‌دهد ویرایش‌های حرفه‌ای را مستقیماً روی گوشی انجام دهند.
فتوشاپ موبایل بسیاری از ویژگی‌های اصلی فتوشاپ دسکتاپ را ارائه می‌دهد، از جمله قابلیت کار با لایه‌ها، ابزارهای انتخاب، ماسک‌ها و قابلیت جدید Tap Select که بخش‌هایی از تصویر را تنها با یک لمس تغییر می‌دهد. این برنامه همچنین با دیگر ابزارهای ادوبی مانند Lightroom، Express و Fresco ادغام شده است.

یکی از جذاب‌ترین ویژگی‌های فتوشاپ موبایل، استفاده از هوش مصنوعی Firefly است که امکان Generative Fill و Generative Expand را فراهم می‌کند. کاربران می‌توانند به‌راحتی بخش‌هایی به تصویر اضافه کنند یا قاب آن را گسترش دهند. همچنین، قابلیت تولید تصویر از ابتدا با Firefly نیز در دسترس خواهد بود.

با وجود امکانات پیشرفته، بسیاری از ابزارهای حرفه‌ای فتوشاپ موبایل تنها با اشتراک پولی در دسترس هستند. ادوبی طرح اشتراکی جدیدی تحت عنوان Photoshop Mobile and Web معرفی کرده است که دسترسی به نسخه‌ی موبایل، وب و آیپد را با قیمت ۷.۹۹ دلار در ماه یا ۶۹.۹۹ دلار در سال فراهم می‌کند. اشتراک پولی شامل ابزارهای پیشرفته‌ای مانند Magic Wand، Clone Stamp، Content-Aware Fill و Advanced Blend Modes می‌شود. کاربران با این طرح می‌توانند ویرایش‌های خود را در موبایل شروع کرده و در نسخه‌ی وب ادامه دهند.

در مجموع، فتوشاپ موبایل گام بزرگی برای ادوبی محسوب می‌شود، اما دسترسی به بهترین قابلیت‌های آن همچنان مستلزم پرداخت هزینه است.

+ نوشته شده در شنبه یازدهم اسفند ۱۴۰۳ ساعت 8:36 توسط شهرام |

رشد بی‌سابقه سرمایه‌گذاری در سخت‌افزار هوش مصنوعی با هدایت فضای ابری

بر اساس گزارش گارتنر، هزینه جهانی برای تراشه‌های هوش مصنوعی و پردازنده‌ها در سال گذشته تقریباً دو برابر شده و به ۱۱۲ میلیارد دلار رسیده است، در حالی که کل بازار نیمه‌هادی‌ها به ۶۲۶ میلیارد دلار بالغ شده است.

بر اساس گزارش IDC، سرمایه‌گذاری جهانی در سخت‌افزار هوش مصنوعی در نیمه اول سال ۲۰۲۴ تقریباً دو برابر شد و به ۴۷.۴ میلیارد دلار رسید. پیش‌بینی می‌شود که این میزان تا سال ۲۰۲۸ از ۲۰۰ میلیارد دلار فراتر رود.

سرورهای هوش مصنوعی با رشد ۱۰۵ درصدی در این بازه زمانی، ۹۵ درصد از کل هزینه‌های زیرساختی AI را به خود اختصاص دادند، در حالی که سرمایه‌گذاری در سخت‌افزار ذخیره‌سازی تنها ۱۸ درصد افزایش یافت.

نقش کلیدی شرکت‌های بزرگ ابری در توسعه زیرساخت هوش مصنوعی
رشد شدید سرمایه‌گذاری، ناشی از حرکت شرکت‌های بزرگ ابری و ارائه‌دهندگان خدمات دیجیتال بوده است. شرکت‌هایی مانند AWS، مایکروسافت و گوگل ده‌ها میلیارد دلار برای توسعه زیرساخت‌های هوش مصنوعی هزینه کرده‌اند و قصد دارند این روند را در نیمه اول ۲۰۲۵ ادامه دهند.

در مقابل، سازمان‌های سنتی با احتیاط بیشتری عمل کرده‌اند. مشکلاتی مانند کمبود قطعات سخت‌افزاری، هزینه بالای مالکیت و کمبود نیروی متخصص، مانع از گسترش سریع زیرساخت‌های هوش مصنوعی در شرکت‌های کوچک‌تر شده است.

تأثیر فضای ابری بر بازار نیمه‌هادی‌ها
تقاضای گسترده فضای ابری برای سخت‌افزار هوش مصنوعی تأثیر قابل توجهی بر بازار نیمه‌هادی‌ها داشته است. بر اساس گزارش گارتنر، هزینه جهانی برای تراشه‌های هوش مصنوعی و پردازنده‌ها در سال گذشته تقریباً دو برابر شده و به ۱۱۲ میلیارد دلار رسیده است، در حالی که کل بازار نیمه‌هادی‌ها به ۶۲۶ میلیارد دلار بالغ شده است.

رشد سخت‌افزار ذخیره‌سازی هوش مصنوعی و کاهش قیمت‌ها
در حالی که سرمایه‌گذاری در سرورها و پردازنده‌های هوش مصنوعی رشد چشمگیری داشته، سخت‌افزار ذخیره‌سازی مسیر متفاوتی را طی کرده است. تنها ۴۰ درصد از هزینه‌کردهای این حوزه توسط ارائه‌دهندگان فضای ابری انجام شده، زیرا قیمت تجهیزات ذخیره‌سازی نسبت به پردازش کمتر و در حال کاهش است. بنا بر اعلام IDC، پیش‌بینی می‌شود سهم سرورها و ذخیره‌سازی هوش مصنوعی از کل زیرساخت فناوری اطلاعات تا سال ۲۰۲۸ به ۵۰ درصد افزایش یابد.

+ نوشته شده در شنبه یازدهم اسفند ۱۴۰۳ ساعت 8:32 توسط شهرام |

علی بابا هوش مصنوعی تولید عکس و ویدئو عرضه کرد

شرکت چینی علی بابا مدل هوش مصنوعی Wan۲.۱ را برای تولید ویدئو و تصویر به طور عمومی یا عبارت دیگر منبع باز عرضه کرده است.

این اقدام برای گسترش پذیرش این سیستم و همچنین افزایش رقابت در حوزه مصنوعی انجام شده است.

پیش از علی بابا دیپ سیک، هوش مصنوعی با منبع باز ارائه کرده بود که به دلیل ارزانی و قابلیت های بالای آن هیجان زیادی میان سرمایه گذاران حوزه فناوری ایجاد کرد. این شرکت چینی چهار نسخه از مدل مذکور به نام Wan ۲.۱ - T۲V-۱.۳B، T۲V-۱۴B، I۲V-۱۴B-۷۲۰P و I۲V-۱۴B-۴۸۰P را ارائه کرده که از داده نوشتاری و تصویری عکس و ویدئو می سازند. ۱۴B نشان دهنده نسخه ای است که ۱۴ میلیارد پارامتر را می پذیرد. این بدان معناست که سیستم می تواند داده های بسیار زیادی را بپذیرد تا نتایج دقیق تری را ارائه کند.

این مدل ها به طور جهانی در پلتفرم های ابر رایانشی علی بابا یعنی ModelScope و HuggingFace برای مقاصد آکادمیک، تحقیقاتی و تجاری عرضه شده اند.

علی بابا جدیدترین مدل هوش مصنوعی تولید ویدئو و عکس خود را در ژانویه و پس از کوتاه کردن نام آن از Wanx به Wan ارائه و قابلیت های آن برای تولید تصاویر بسیار واقع گرایانه را تبلیغ کرد. همچنین این شرکت دیروز پیش نمایش مدل استدلالی QwQ-Max را ارائه کرد و قصد دارد هنگام عرضه کامل آن را به منبع باز عرضه کند.

شرکت چینی مذکور همچنین در هفته جاری از سرمایه گذاری حداقل ۳۸۰ میلیارد یوانی( ۵۲ میلیارد دلاری) طی سه سال آینده برای برجسته تر کردن ابر رایانشی و زیرساخت هوش مصنوعی خبر داد.

+ نوشته شده در پنجشنبه نهم اسفند ۱۴۰۳ ساعت 8:35 توسط شهرام |

روش‌های جدید ردیابی کاربران در مرورگر کروم

اگر از مرورگر کروم استفاده می‌کنید، احتمالاً تحت ردیابی هستید.

اگر از مرورگر کروم استفاده می‌کنید، احتمالاً تحت ردیابی هستید. با این‌که انتظار داشتیم با از بین رفتن کوکی‌های ردیابی، این موضوع کمتر تهاجمی شود، اما در واقع بدتر شده است.

دلیل این موضوع، احیای ناگهانی «فینگرپرینتی دیجیتال» است، روشی که حتی گوگل آن را «نادرست» توصیف کرده است. اما خبر خوب این است که راهی برای جلوگیری از این ردیابی وجود دارد، اما بدی خبر این است که باید نحوه استفاده از مرورگر خود را تغییر دهید.

گوگل در حال بروزرسانی نحوه ردیابی آدرس IP در کروم است، به این معنی که موقعیت و فعالیت شما در وب جمع‌آوری می‌شود. شرکت برنامه‌ای برای حفاظت از IP دارد که «IP Protection» نام دارد و این ویژگی دسترسی به آدرس IP اصلی کاربر را در زمینه‌های سوم محدود می‌کند. اما محدودیت آن باعث می‌شود که فقط برای حالت ناشناس (Incognito) کروم کار می‌کند.

این ویژگی شبیه به «Private Relay» اپل است که آدرس IP شما را مخفی می‌کند و از هیچ‌یک از طرفین نمی‌توان همزمان آدرس شما و سایت‌هایی را که بازدید می‌کنید، ببیند. گوگل نیز یک آدرس IP جغرافیایی غیرمستقیم را برای حفظ کارکرد وب ارائه می‌دهد.

با Private Relay اپل، درخواست‌های شما از طریق دو رله امن ارسال می‌شوند. آدرس IP شما برای ارائه‌دهنده شبکه و رله اول اپل قابل مشاهده است، اما رکورد DNS شما رمزگذاری می‌شود، بنابراین هیچ‌یک از طرفین نمی‌توانند آدرس وب‌سایتی را که می‌خواهید بازدید کنید، ببینند. رله دوم که توسط یک ارائه‌دهنده محتوای سوم اداره می‌شود، یک آدرس IP موقت تولید می‌کند، نام وب‌سایتی را که درخواست داده‌اید رمزگشایی می‌کند و شما را به آن متصل می‌کند.

مشکل این است که این حفاظت فقط برای جلسات مرور ناشناس در کروم کار می‌کند. اگر به‌صورت عادی مرور می‌کنید، این حفاظت‌ها اعمال نمی‌شود. این در حالی است که Private Relay اپل تمام ترافیک مرورگر Safari را محافظت می‌کند. این حفاظت از ردیابی IP هنوز در حال توسعه است، اما سریع‌تر از نوآوری دیگر گوگل در زمینه یک کلیک برای غیرفعال کردن کوکی‌های ردیابی در کروم خواهد آمد. این ویژگی احتمالاً درگیر بحث‌های نظارتی و صنعتی شود و ممکن است زمان‌بر باشد تا به مرورگر شما برسد.

+ نوشته شده در پنجشنبه نهم اسفند ۱۴۰۳ ساعت 8:34 توسط شهرام |

گسترش «اپراتور» ChatGPT به خارج از آمریکا؛ قابلیت‌های جدید در راه است

OpenAI همچنان در حال بهبود عملکرد اپراتور بر اساس بازخورد کاربران است و این ویژگی فعلاً در مرحله پیش‌نمایش تحقیقاتی قرار دارد. با این حال، در صورت موفقیت، می‌تواند تحول بزرگی در اتوماسیون وظایف آنلاین ایجاد کند.

OpenAI اعلام کرده که عامل هوش مصنوعی جدید این شرکت، با نام اپراتور (Operator)، اکنون در استرالیا، برزیل، کانادا، هند، ژاپن، سنگاپور، کره جنوبی، بریتانیا و اکثر کشورهایی که ChatGPT در آنها فعال است، در دسترس کاربران Pro قرار گرفته است.

این ابزار که در ژانویه ابتدا در ایالات‌متحده معرفی شد، به عنوان یک عامل هوش مصنوعی طراحی شده که می‌تواند از طریق وب وظایف مختلفی را برای کاربران انجام دهد. با این حال، اپراتور هنوز در اتحادیه اروپا، سوئیس، نروژ، لیختن‌اشتاین و ایسلند عرضه نشده است.

اپراتور چه کاری انجام می‌دهد؟
اپراتور می‌تواند، از طریق کار با مرورگر، فرم‌ها را پر کند، رزرو رستوران انجام دهد و خریدهای آنلاین را برای کاربران ثبت کند. این ابزار از مدلی به نام عامل کاربر-رایانه (CUA) قدرت می‌گیرد که توانایی دیدن و تعامل با دکمه‌ها، منوها و فیلدهای متنی را دارد. در واقع، اپراتور مانند یک کاربر واقعی می‌تواند به گونه‌ای که انگار در حال استفاده از ماوس و صفحه‌کلید است روی صفحات وب به تعامل بپردازد.

دسترسی محدود، اما برنامه‌ای برای گسترش
در حال حاضر، اپراتور فقط برای کاربران Pro که ماهانه 200 دلار پرداخت می‌کنند، فعال است. اما OpenAI قصد دارد این قابلیت را در آینده برای کاربران طرح‌های Plus، Team و Enterprise نیز ارائه کند. هدف نهایی این شرکت، ادغام کامل اپراتور با ChatGPT است تا کاربران بیشتری بتوانند از این ویژگی بهره‌مند شوند.

افزایش چشمگیر کاربران ChatGPT
بر اساس گزارش‌ها، تعداد کاربران هفتگی ChatGPT به 400 میلیون نفر رسیده است که دو برابر تعداد کاربران در ماه اوت 2024 محسوب می‌شود. با گسترش اپراتور و توسعه قابلیت‌های آن، انتظار می‌رود که این عدد باز هم افزایش یابد.

OpenAI همچنان در حال بهبود عملکرد اپراتور بر اساس بازخورد کاربران است و این ویژگی فعلاً در مرحله پیش‌نمایش تحقیقاتی قرار دارد. با این حال، در صورت موفقیت، می‌تواند تحول بزرگی در اتوماسیون وظایف آنلاین ایجاد کند.

+ نوشته شده در پنجشنبه نهم اسفند ۱۴۰۳ ساعت 8:30 توسط شهرام |

رونمایی از آیفون 16e با قابلیت‌های هوش مصنوعی

شرکت اپل از یک آیفون جدید رونمایی کرده است که قابلیت‌های هوش مصنوعی را با قیمتی پایین‌تر از مدل‌های پرچم‌دار خود ارائه می‌دهد.

به گفته اپل، آیفون «۱۶ای» (16e) دارای همان پردازنده آیفون ۱۶ است اما در بخش‌هایی مانند تعداد دوربین‌ها نسبت به مدل اصلی امکانات کمتری دارد.

اپل در ماه‌های اخیر در تلاش بوده تا محصولی نوآورانه پیدا کند که مشتریان را هیجان‌زده کند. چرا که آمارها نشان می‌دهند فروش آیفون در پایان سال گذشته کاهش یافته است.

این شرکت امیدوار است که با ارائه قابلیت‌های پیشرفته هوش مصنوعی در یک گوشی ارزان‌تر، این مشکل را برطرف کند.

نام مدل جدید آیفون آشکارا به سری آیفون اس‌ای (SE) اشاره دارد که از سال ۲۰۱۶ تا ۲۰۲۲ عرضه می‌شد و قیمت کمتری داشت.

اپل اعلام کرده است که آیفون جدید از ۲۱ فوریه در ۵۹ کشور برای پیش‌فروش در دسترس خواهد بود.

این گوشی با قیمت پایه ۵۹۹ دلار عرضه شده است، که ۲۰۰ دلار کمتر از آیفون ۱۶ است. با این حال این قیمت بیش از دو برابر قیمت آیفون اس‌ای اصلی در سال ۲۰۱۶ محسوب می‌شود.
پائولو پسکاتوره، تحلیل‌گر صنعت، در این باره گفت: «این آیفون اکنون به یکی از قدرتمندترین و در عین حال مقرون‌به‌صرفه‌ترین آیفون‌های موجود در بازار تبدیل شده است.»

وی افزود: «این حرکت می‌تواند به تسریع پذیرش فناوری‌های جدید، به‌ویژه ورود اپل به حوزه هوش مصنوعی باApple Intelligence کمک کند.»

اپل در دهه گذشته ۱۸۹ میلیارد دلار در حوزه هوش مصنوعی هزینه کرده است.

تحلیلگران می‌گویند جالب‌ترین نکته پنهان در آیفون جدید مودم جدید آن موسوم به (C1 است که از قابلیت اتصال 5G پشتیبانی می‌کند.

این اولین بار است که اپل از طراحی مودم اختصاصی خود برای آیفون استفاده می‌کند. پیش از این اپل برای اتصال سلولی به تراشه‌های کوالکام و اینتل وابسته بود.

مودم‌های اختصاصی به اپل کمک می‌کنند تا به چشم‌اندازی که تیم کوک رئیس این شرکت در سال ۲۰۰۹ ترسیم کرده بود، یعنی کنترل کامل فناوری محصولات خود، نزدیک‌تر شود.

در این گوشی همچنین اپل تصمیم گرفته از همان تراشه A18 که در دستگاه‌های گران‌قیمت‌تر خود به کار رفته است، استفاده کند.

این بدان معناست که آیفون جدید عرضه‌شده قادر به اجرای همان بازی‌ها و برنامه‌های دیگر آیفون‌ها خواهد بود، اما هوش مصنوعی تقریباً به عنوان قلب این تصمیم در نظر گرفته شده است.

تیم کوک، رئیس اپل در مراسم رونمایی با اشاره به قابلیت‌های هوش مصنوعی در آیفون جدید گفت: «این قابلیت‌ها به شما کمک می‌کند در زمان خود صرفه‌جویی کنید و سریع‌تر کارها را انجام دهید».

هرچند سایر شرکت‌های سازنده گوشی‌های هوشمند نیز ویژگی‌های مشابهی را در دستگاه‌های خود دارند، اما آیفون ۱۶ای ارزان‌ترین راه برای دسترسی به هوش مصنوعی اپل محسوب می‌شود.

کارشناسان می‌گویند به نظر می‌رسد اپل این گوشی را به طور خاص برای مالکان مدل‌های قدیمی‌تر در نظر گرفته تا آن‌ها را به ارتقای دستگاه‌های تلفن همراه خود ترغیب کند.

+ نوشته شده در شنبه چهارم اسفند ۱۴۰۳ ساعت 13:39 توسط شهرام |

همه‌چیز درباره Grok 3، هوش مصنوعی ایلان ماسک

سرانجام روز موعود فرارسید و مدل هوش مصنوعی Grok 3 شرکت xAI ایلان ماسک صبح دیروز به وقت تهران رونمایی شد.

این مدل در واقع یک پاسخ به رقبایی مانند GPT-4o از اپن‌ای‌آی و جمینای از گوگل است. Grok 3 توانایی تحلیل تصاویر و پاسخ به پرسش‌های پیچیده را داراست. Grok 3 با استفاده از دیتاسنتر بزرگی در ممفیس، شامل حدود ۲۰۰هزار پردازنده گرافیکی، آموزش دیده و قدرت پردازشی آن ۱۰برابر بیشتر از نسخه قبلی، Grok 2، است. همچنین، مجموعه داده‌های آموزشی آن به‌طور قابل‌توجهی افزایش یافته است.

تقابل با گوگل
ایلان ماسک در جریان رونمایی تصویری از Grok 3 در شبکه اجتماعی ایکس اعلام کرد که این مدل نسبت به Grok 2 از نظر توانایی‌ها بهبود قابل‌توجهی یافته است؛ آن‌هم در مدت‌زمان بسیار کوتاه. همچنین، تیم xAI از محصول جدیدی به نام Deep Search (جستجوی عمیق) پرده‌برداری کرد که به‌عنوان یک موتور جستجوی نسل جدید طراحی شده است.
این قابلیت به کاربران اجازه می‌دهد تا نتایج جستجو را عمیق‌تر و دقیق‌تر دریافت کنند؛ احتمالا با بهره‌گیری از ترکیب مدل‌های زبانی پیشرفته و تحلیل هوش مصنوعی روی داده‌های آنلاین. این حرکت، نشان‌دهنده تلاش xAI برای رقابت مستقیم با موتورهای جستجویی مانند گوگل و بینگ است، درحالی‌که مدل‌های زبانی مانند GPT-4o هم به سمت بهبود قابلیت‌های جستجوی مبتنی بر هوش مصنوعی حرکت می‌کنند.

عملکرد بهتر
Grok 3 در مقایسه‌های مختلف، از جمله AIME (ارزیابی عملکرد هوش مصنوعی در مسائل ریاضی) و GPQA (ارزیابی مدل‌ها با سؤالات فیزیک، زیست‌شناسی و شیمی در سطح دکترا)، عملکرد بهتری نسبت به GPT-4o نشان داده است.
علاوه بر این، Grok 3 دارای نسخه‌های مختلفی مانند Grok 3 Mini برای پاسخ‌دهی سریع‌تر و Grok 3 Reasoning برای حل مسائل پیچیده و تحلیل دقیق داده‌ها است. Grok 3 برای مشترکان پرمیوم پلاس ایکس در دسترس است.
همچنین، اشتراک جدیدی به نام SuperGrok با هزینه ماهانه ۳۰دلار یا سالانه ۳۰۰دلار معرفی شده که قابلیت‌های پیشرفته‌تری مانند جستجوی عمیق و تولید نامحدود تصاویر را ارائه می‌دهد. در هفته‌های آینده، قابلیت تعامل صوتی نیز به این مدل افزوده خواهد شد تا کاربران بتوانند به‌صورت مکالمه‌ای با آن ارتباط برقرار کنند.

رقابت شدید با آلتمن
ماسک که همواره درباره خطرات بالقوه هوش مصنوعی ابراز نگرانی کرده است، در سال۲۰۲۳ شرکت xAI را تاسیس کرد تا وارد بازار هوش مصنوعی مولد شود؛ بازاری که رقبایی همچون چت جی‌پی‌تی در آن فعال هستند.
در سپتامبر سال گذشته، اپن‌ای‌آی مدل پیشرفته o1 را معرفی کرد که توانایی‌های استدلالی داشته و می‌توانست مسائل پیچیده در علوم، کدنویسی و ریاضیات را حل کند. ماسک در ابتدا یکی از بنیان‌گذاران اپن‌ای‌آی بود و در سال۲۰۱۵، به همراه سم آلتمن و دیگران، این سازمان را به‌عنوان یک نهاد غیرانتفاعی تاسیس کرد.

قدرت پردازشی XAI
xAI ایلان ماسک دارای یک «ابرکامپیوتر Colossus» (تحلیل رمز) است که برای آموزش مدل‌های هوش مصنوعی استفاده می‌شود.
این شرکت سال گذشته اعلام کرد که از خوشه‌ای شامل ۱۰۰هزار پردازنده گرافیکی پیشرفته انویدیا برای آموزش مدل‌های خود استفاده می‌کند. اما در روز سه‌شنبه، اعلام شد که این ظرفیت برای آموزش Grok 3 دو برابر شده است.

افزایش آلودگی‌های زیست‌محیطی
xAI از 15توربین گازی برای تامین انرژی ابرکامپیوتر خود در ممفیس، تنسی استفاده خواهد کرد. طبق مجوز ارائه‌شده، این توربین‌ها می‌توانند از ژوئن۲۰۲۵ تا ژوئن ۲۰۳۰ بی‌وقفه فعال باشند. اما آلودگی‌های زیست‌محیطی که این توربین‌های ایجاد می‌کنند، می‌تواند دردسری برای اهالی شهر باشد. بر اساس اعلام کارشناسان، هر توربین سالانه ۱۱.۵۱تن آلاینده‌های خطرناک منتشر می‌کند که این میزان از حد مجاز آژانس حفاظت محیط زیست آمریکا (EPA) بیشتر است.

+ نوشته شده در پنجشنبه دوم اسفند ۱۴۰۳ ساعت 8:41 توسط شهرام |

کنفرانس هوش مصنوعی مولد متا در آوریل برگزار می‌شود

شرکت «متا» روز سه‌شنبه اعلام کرد میزبان اولین کنفرانس توسعه‌دهندگان خود خواهد بود که به هوش مصنوعی مولد اختصاص دارد.

کنفرانس شرکت «متا»(Meta) که با الهام از خانواده مدل‌های هوش مصنوعی «لاما»(Llama) به نام «لاماکان»(LlamaCon) شناخته می‌شود، در ۲۹ آوریل برگزار خواهد شد.

متا گفت که قصد دارد جدیدترین پیشرفت‌های خود در هوش مصنوعی منبع باز را برای کمک به توسعه‌دهندگان به منظور ساخت اپلیکیشن‌ها و محصولات شگفت‌انگیز معرفی کند. متا خاطرنشان کرد که جزئیات بیشتر به زودی در دسترس قرار خواهند گرفت. کنفرانس سالانه توسعه‌دهندگان این شرکت موسوم به «متا کانکت»(Meta Connect) نیز در ماه سپتامبر برگزار خواهد شد.

متا چندین سال پیش رویکرد منبع باز را برای توسعه فناوری‌های هوش مصنوعی در تلاش برای تقویت اکوسیستمی از اپلیکیشن‌ها و پلتفرم‌ها پذیرفت. هنوز فاش نشده است که چه تعداد برنامه یا سرویس روی آن ساخته شده اما پیشتر اشاره شده بود که شرکت‌های «گلدمن ساکس»(Goldman Sachs)، «نامورا هولدینگز»(Nomura Holdings)، «ای‌تی‌اندتی»(AT&T)، «دوردش»(DoorDash) و «اکسنچر»(Accenture) از لاما استفاده می‌کنند.

متا ادعا می‌کند که مدل لاما صدها میلیون بار دانلود شده است و حداقل ۲۵ شرکت میزبان آن هستند. از جمله این شرکت‌ها می‌توان به «انویدیا»(Nvidia)، «دیتابریکس»(Databricks)، «گروک»(Groq)، «دل»(Dell) و «اسنوفلیک»(Snowflake) اشاره کرد. برخی از این شرکت‌ها تجهیزات اضافی ساخته‌اند که به مدل‌ها امکان می‌دهد تا به داده‌های اختصاصی رجوع کنند و با تأخیر کمتر اجرا شوند.

با ظهور شرکت چینی هوش مصنوعی «دیپ‌سیک»(DeepSeek) که توانست هوش مصنوعی منبع باز را برای رقابت با متا منتشر کند، به نظر می‌رسد این شرکت گرفتار شده است.

براساس گزارش‌ها، متا معتقد است یکی از مدل‌های جدیدتر دیپ‌سیک می‌تواند از نسخه بعدی لاما که قرار است در هفته‌های آینده منتشر شود، بهتر عمل کند. گفته می‌شود که متا تلاش کرده تا اتاق‌های فکر را راه‌اندازی کند تا بفهمد که دیپ‌سیک چگونه هزینه اجرا و استقرار مدل‌ها را کاهش داده است و بتواند این آموخته‌ها را در توسعه لاما به کار بگیرد.

متا اخیرا گفت که امسال ۸۰ میلیارد دلار را برای پروژه‌های مرتبط با هوش مصنوعی از جمله ساخت مراکز جدید داده هزینه خواهد کرد.

+ نوشته شده در پنجشنبه دوم اسفند ۱۴۰۳ ساعت 8:39 توسط شهرام |