DaVinci Resolve 19: ویرایش حرفه‌ای رایگان ویدئوهای 8k با هوش مصنوعی

نقطه قوت DaVinci، امکانات گسترده رایگان و قابلیت همکاری همزمان چند کاربر در یک پروژه است، در حالی که مزیت پریمیر ادغام روان با سایر نرم‌افزارهای آدوبی مانند After Effects است.

DaVinci Resolve 19 جدیدترین نسخه از نرم‌افزار حرفه‌ای تدوین و پس‌تولید ویدئو است که امکانات و قابلیت‌های بی‌نظیری را در اختیار کاربران قرار می‌دهد. این نرم‌افزار تنها ابزار جامع در دنیاست که ویرایش 8K، تصحیح رنگ، جلوه‌های ویژه و تدوین صدا را در یک محیط واحد ارائه می‌کند. یکی از ویژگی‌های برجسته این نسخه، جابجایی سریع و یک‌کلیکی بین بخش‌های مختلف است.

نسخه ۱۹ این نرم‌افزار با استفاده از موتور هوش مصنوعی پیشرفته DaVinci Neural Engine بیش از ۱۰۰ ویژگی جدید و ارتقاء یافته دارد. از جمله ابزارهای جدید مبتنی بر هوش مصنوعی می‌توان به ویرایش مبتنی بر متن تایم‌لاین، جداسازی گفت‌وگو، ریمیکس موسیقی و کاهش نویز UltraNR اشاره کرد. ابزار IntelliTrack AI نیز امکان هماهنگ‌سازی حرکت تصویر با صدای سه‌بعدی را فراهم کرده است.

برای علاقه‌مندان به تصحیح رنگ حرفه‌ای، ابزارهای جدیدی مانند ColorSlice برای گریدینگ برداری و Film Look Creator اضافه شده‌اند. همچنین امکاناتی برای تولید زنده تلویزیونی اضافه شده که به کاربران امکان می‌دهد ضبط زنده دوربین‌ها را به صورت آنی انتخاب و با قابلیت اسلوموشن پخش کنند.

با اینکه DaVinci Resolve نسخه‌ای رایگان دارد که اکثر نیازها را پوشش می‌دهد، اما نسخه Studio با قیمت ۲۹۹ دلار برای استفاده حرفه‌ای توصیه می‌شود. در مقابل، Adobe Premiere Pro نیاز به اشتراک ماهانه یا سالانه دارد. نقطه قوت DaVinci، امکانات گسترده رایگان و قابلیت همکاری همزمان چند کاربر در یک پروژه است، در حالی که مزیت پریمیر ادغام روان با سایر نرم‌افزارهای آدوبی مانند After Effects است.

البته این نرم‌افزار برای سیستم‌های ضعیف‌تر مناسب نیست و برای عملکرد بهینه، حداقل به کارت گرافیک مجزا با ۲ گیگ VRAM، رم ۱۶ گیگ و پردازنده ۸ هسته‌ای نیاز دارد.

در کنار DaVinci، نرم‌افزارهای رایگان دیگری نیز وجود دارند مانند VSDC، Shotcut و Movavi که جایگزین‌های مناسبی برای پریمیر به حساب می‌آیند.

آیا هوش مصنوعی می‌تواند داروها و مواد آینده را طراحی کند؟

فرآیند کشف مولکول‌هایی که برای تولید داروها و مواد جدید مناسب باشند، همواره فرآیندی پرهزینه، پیچیده و زمان‌بر بوده است. پژوهشگران برای غربال‌کردن انبوه گزینه‌های بالقوه، باید ماه‌ها زمان صرف کرده و از منابع محاسباتی گسترده‌ای بهره بگیرند.

مدل‌های زبانی بزرگ (LLM) مانند ChatGPT می‌توانند این مسیر طاقت‌فرسا را کوتاه‌تر کنند، اما آموزش دادن به چنین مدلی برای درک و استدلال دربارهٔ اتم‌ها و پیوندهایی که مولکول‌ها را شکل می‌دهند ــ همان‌گونه که کلمات یک جمله را تحلیل می‌کند ــ چالشی علمی بوده است.

اکنون گروهی از پژوهشگران MIT و آزمایشگاه هوش مصنوعی MIT-IBM Watson رویکردی نوین و امیدوارکننده ارائه داده‌اند. آن‌ها با ترکیب LLM با نوعی دیگر از مدل‌های یادگیری ماشین به نام «مدل‌های گراف‌محور»، توانسته‌اند روشی چندوجهی برای طراحی مولکول‌ها توسعه دهند. این مدل‌های گراف‌محور به‌طور خاص برای پیش‌بینی ساختارهای مولکولی طراحی شده‌اند.

این سامانهٔ نوین با استفاده از یک LLM پایه، ابتدا درخواست کاربر را به زبان طبیعی تفسیر می‌کند، سپس به‌صورت خودکار میان این مدل زبانی و ماژول‌های گرافی جابه‌جا می‌شود تا ساختار مولکولی را طراحی کند، دلایل طراحی را توضیح دهد و گام‌به‌گام، نقشهٔ سنتز (ساخت) مولکول را ارائه دهد.

بر این اساس، سیستم LLM از ترکیب متن، گراف و مراحل واکنش شیمیایی استفاده می‌کند و این داده‌های متنوع را به زبانی مشترک برای پردازش در مدل زبانی تبدیل می‌کند.

در آزمایش‌های مقایسه‌ای، این روش جدید توانست مولکول‌هایی بسیار دقیق‌تر و با احتمال بالاتری برای سنتز موفق ارائه دهد و نرخ موفقیت را از ۵ درصد به ۳۵ درصد برساند.

جالب آن‌که این سیستم حتی از مدل‌های زبانی ۱۰ برابر بزرگ‌تر که فقط با متن کار می‌کنند نیز عملکرد بهتری داشت؛ نکته‌ای که نشان می‌دهد «چندوجهی‌بودن» عامل کلیدی در موفقیت این فناوری بوده است.

مایکل سان (دانشجوی دکترای MIT و از نویسندگان مقالهٔ این پژوهش) می‌گوید: «اگر این سیستم بتواند از ابتدا تا انتها فرآیند طراحی و ساخت یک مولکول را خودکار کند، صرفه‌جویی بزرگی برای شرکت‌های داروسازی خواهد بود. کافی است مدل در عرض چند ثانیه پاسخ طراحی را ارائه دهد.»

ترکیب متن و گراف: بهترین‌های دو دنیا
مدل‌های زبانی بزرگ، ذاتاً برای درک شیمی ساخته نشده‌اند؛ آن‌ها داده‌ها را به توکن‌هایی تبدیل می‌کنند و براساس آن‌ها، پیش‌بینی کلمهٔ بعدی را انجام می‌دهند. اما ساختار مولکول‌ها مانند جملات نیست؛ آن‌ها بیشتر شبیه گراف‌هایی هستند که شامل اتم‌ها (گره‌ها) و پیوندها (یال‌ها) بدون نظم خاصی هستند.

از سوی دیگر، مدل‌های گرافی قادرند ساختارهای مولکولی را به‌صورت دقیق‌تری نمایش دهند، اما نمی‌توانند زبان طبیعی را درک کنند و اغلب خروجی‌هایی پیچیده و غیرقابل تفسیر تولید می‌کنند.

اینجاست که «لامول» (Llamole) ــ مخفف Large Language Model for Molecular Discovery ــ وارد میدان می‌شود. این سیستم ابتدا درخواست زبانی کاربر را درک کرده و سپس به کمک ماژول‌های گرافی ساختار مناسب را طراحی می‌کند.

برای نمونه، اگر کاربری بخواهد مولکولی با وزن مولکولی ۲۰۹ داشته باشد که از سد خونی-مغزی عبور کرده و HIV را مهار کند، سیستم ابتدا این خواسته را تحلیل کرده، سپس ماژول‌های گرافی را فعال می‌کند: ماژول نخست با مدل انتشار گراف، ساختار مولکولی را طراحی می‌کند؛ ماژول دوم با شبکهٔ عصبی گرافی، ساختار طراحی‌شده را برای مدل LLM بازکدگذاری می‌کند؛ و ماژول سوم نیز مراحل واکنش شیمیایی را برای سنتز مولکول پیشنهاد می‌دهد.

ساختارهایی ساده‌تر با هزینهٔ کمتر
در پایان، خروجی سامانه شامل تصویر مولکول، توضیح متنی ویژگی‌های آن و فهرستی از مراحل سنتز شیمیایی است. آزمایش‌ها نشان دادند که این سیستم در طراحی مولکول‌هایی با ساختار ساده‌تر و مواد اولیهٔ ارزان‌تر، موفق‌تر از ۱۰ مدل LLM استاندارد، ۴ مدل تنظیم‌شده، و حتی یک روش پیشرفتهٔ دامنه‌محور عمل کرده است.

گنگ لیو می‌گوید: «مدل‌های زبانی معمولی نمی‌توانند مراحل پیچیدهٔ سنتز را به‌درستی طراحی کنند، اما رویکرد ما هم ساختار بهتری تولید می‌کند و هم مراحل ساخت را ساده‌تر می‌سازد.»

شایان ذکر است که فعلاً این مدل تنها با ۱۰ ویژگی مولکولی عددی آموزش دیده است، اما پژوهشگران در گام‌های بعدی می‌خواهند آن را به تمام ویژگی‌های مولکولی تعمیم دهند.

هوش مصنوعی، قلم‌مو جدید خلاقیت! سه غول تولید تصویر را بشناسید

دنیای تولید تصویر با هوش مصنوعی دیگر خیال‌پردازی نیست، بلکه به ابزاری واقعی و قدرتمند تبدیل شده است! اگر می‌خواهید بدانید کدام ابزار برای نیاز شما مناسب‌تر است—از دقت بی‌نظیر ChatGPT گرفته تا سرعت و طنز Grok و کاربرد حرفه‌ای Gemini—با ما همراه باشید، انتخاب درست می‌تواند تفاوت بزرگی ایجاد کند.

با پیشرفت فناوری، تبدیل متن به تصویر در ثانیه‌ها به واقعیت تبدیل شده است. سه ابزار برتر این حوزه چت‌جی‌پی‌تی (ChatGPT)، گروک (Grok) و جمینای (Gemini) هرکدام سبک و کاربرد متفاوتی دارند. در این گزارش، عملکرد این ابزارها را بررسی می‌کنیم.


چت‌جی‌پی‌تی: دقیق، قابل ویرایش و همه‌کاره

ابزار تولید تصویر ChatGPT مبتنی بر DALL·E 3، تصاویری با جزئیات بالا و ساختار محکم خلق می‌کند. این مدل حتی با دستورات پیچیده (مانند طراحی یک شهر علمی-تخیلی یا نقاشی سورئال) به‌خوبی عمل می‌کند. قابلیت ویرایش بخشی از تصویر پس از تولید، امتیاز بزرگی محسوب می‌شود؛ مثلاً تغییر آسمان یا لباس یک شخصیت بدون نیاز به شروع مجدد.

محدودیت: اجتناب از تولید چهره‌های واقعی یا مضامین حساس.


گروک: سریع، طنز و مناسب محتوای اینترنتی

ابزار xAI (وابسته به X/Twitter) با سرعت بالا تصاویر کارتونی و مملو از انرژی تولید می‌کند. این ابزار برای ساخت میم، محتوای طنز و پست‌های سریع ایده‌آل است اما در صحنه‌های واقع‌گرا دچار اشتباهات هندسی یا چهره‌های تحریف‌شده می‌شود. عدم وجود ابزار ویرایش، اصلاح اشکالات را دشوار می‌کند.


جمینای: سازمان‌یافته و کاربردی برای کارهای حرفه‌ای

ابزار گوگل بر تولید تصاویر مرتبط با پروژه‌های کاری متمرکز است. نمودارها، اینفوگرافی‌ها و تصاویر آموزشی با سبکی آرام و بدون جزئیات اضافی از ویژگی‌های آن است. سرعت پایین‌تر و اجتناب از المان‌های جسورانه، آن را برای محیط‌های آکادمیک یا اداری مناسب می‌کند.


جمع‌بندی: انتخاب بر اساس نیاز

چندمنظوره: ChatGPT با تعادل بین کیفیت و خلاقیت
محتواهای طنز:Grok با سرعت و انرژی بالا
پروژه‌های ساختاریافته: Gemini با تمرکز بر کاربرد عملی

هیچ‌یک به‌طور مطلق برتر نیستند. انتخاب نهایی به نیاز کاربر بستگی دارد: دقت، سرعت یا تخصصی‌بودن.

رونمایی از «بالی»؛ ربات پیشخدمت هوش مصنوعی سامسونگ

سامسونگ از عرضه رباتی مجهز به هوش مصنوعی خبر داد که برای ایفای نقش دستیار شخصی در خانه طراحی شده است.

ربات سه‌چرخه «بالی»‌(Ballie) دارای پروژکتور، بلندگو و میکروفون داخلی است و همچنین توانایی کنترل قابلیت‌های خانه هوشمند مانند گرمایش و نور را دارد.

این ربات که نخستین‌ بار سال ۲۰۲۰ رونمایی شد، به اندازه یک توپ فوتبال است و پیش از نخستین عرضه عمومی، چند بهسازی و ارتقا روی آن انجام شده است؛ از جمله ادغام با هوش مصنوعی جمنای گوگل.

یونگ‌جه کیم، معاون اجرایی شرکت سامسونگ الکترونیکس، گفت: «از طریق این همکاری، سامسونگ و گوگل کلاود، نقش هوش مصنوعی در خانه را بازتعریف می‌کنند.»

«با ترکیب توانمندی استدلال چندوجهی قدرتمند جمنای با قابلیت‌های هوش مصنوعی سامسونگ در بالی، ما با اتکا به همکاری باز، عصری نو از همراهان هوش مصنوعی شخصی‌سازی‌شده را آغاز می‌کنیم‌ــ همراهانی که با کاربران حرکت می‌کنند، نیازهای آن‌ها را پیش‌بینی می‌کنند و به شکلی پویاتر و معنادارتر از همیشه، با آن‌ها تعامل دارند.»

هوش مصنوعی مولد پیشرفته به صاحبان آن این امکان را خواهد داد که با «بالی» گفتگو کنند و دوربین امکانی فراهم می‌کند تا ربات بتواند درباره محیط اطراف خود بازخورد مستقیمی ارائه دهد.

این قابلیت به «بالی» اجازه می‌دهد به کاربران پیشنهادهای مربوط به سبک پوشش بدهد یا برای وعده‌های غذایی، پیشنهادهایی درباره همراه کردن آن‌ها با نوع مناسب شراب ارائه کند.

پروژکتور داخلی سبب می‌شود که ربات بتواند پیش‌بینی‌های دقیق وضعیت هوا، مسیرها یا اطلاعات دیگر را روی دیوار نمایش دهد.

سامسونگ در یک پست وبلاگی نوشت: «بالی با استدلال پیشرفته‌ای که با جمنای فعال شده است، قادر خواهد بود نه‌تنها در مدیریت خانه، بلکه در مدیریت سلامت و تندرستی نیز به کاربران کمک کند.»

«برای نمونه، یک کاربر می‌تواند به بالی بگوید: 'امروز احساس خستگی می‌کنم'. بالی در ادامه می‌تواند با استفاده از پشتوانه جمنای در جستجوی گوگل، توصیه‌هایی متناسب برای بهبود سطح انرژی ارائه دهد. از جمله به‌ اشتراک‌گذاری پیشنهادهایی از منابع قابل‌اعتماد درباره این‌که چگونه بیشتر ورزش کند، محیط خواب خود را بهینه‌سازی یا الگوهای خواب کاربران را پایش کند.»

سامسونگ تاریخ دقیق عرضه این ربات را اعلام نکرد، اما گفت که این ربات تابستان امسال در ایالات متحده و کره در دسترس خواهد بود.

سایر شرکت‌های بزرگ فناوری نیز دستیارهای رباتی برای خانه معرفی کرده‌اند، اگرچه هیچ‌یک به‌طور گسترده استفاده نشده‌اند.

ربات «آسترو» آمازون نیز قابلیت دنبال‌ کردن کاربران در خانه و ایفای نقش دستیار شخصی را دارد، هرچند در اصل برای نظارت امنیتی در خانه طراحی شده است. این ربات در حال حاضر فقط «با دعوت‌نامه» در دسترس است و قیمت آن ۱۶۰۰ دلار است.

پروژه جدید OpenAI؛ شبکه‌ای اجتماعی با چاشنی هوش مصنوعی

OpenAI در حال آزمایش یک شبکه اجتماعی مشابه X است؛ اقدامی که ممکن است عرصه رقابت را برای ایلان ماسک و متا تنگ‌تر کند و شکاف‌ها در درگیری‌های حقوقی با ماسک را عمیق‌تر سازد.

طبق گزارش وب‌سایت The Verge، شرکت OpenAI در حال کار بر روی شبکه اجتماعی جدیدی مشابه X (توییتر سابق) است. این پروژه که هنوز در مراحل ابتدایی خود قرار دارد، به‌طور داخلی در قالب یک نمونه اولیه توسعه یافته که تمرکز آن بر تولید تصویر با استفاده از مدل ChatGPT بوده و دارای یک فید اجتماعی (social feed) است.

مدیرعامل OpenAI، سم آلتمن، به صورت خصوصی با افراد خارج از شرکت درباره این پروژه مشورت کرده و بازخوردهایی دریافت کرده است.
هنوز مشخص نیست که این شبکه اجتماعی به‌عنوان یک اپلیکیشن مستقل عرضه خواهد شد یا در چارچوب ChatGPT ادغام می‌شود.

اگر این پلتفرم اجتماعی به واقع راه‌اندازی شود، می‌تواند تنش‌ها بین آلتمن و ایلان ماسک، مالک X و از بنیان‌گذاران OpenAI را افزایش دهد. گفتنی‌ست ماسک در سال ۲۰۱۸ از این استارتاپ خارج شد؛ زمانی که OpenAI هنوز در مراحل اولیه توسعه هوش مصنوعی مولد بود.

روابط بین دو طرف اخیراً تیره‌تر شده است. در فوریه گذشته، کنسرسیومی به رهبری ایلان ماسک، پیشنهادی به ارزش ۹۷.۴ میلیارد دلار برای تصاحب OpenAI ارائه داد که آلتمن با جمله «نه، ممنون» آن را رد کرد.
ماسک همچنین در سال گذشته از OpenAI و آلتمن شکایت کرد و مدعی شد آنها از هدف اولیه خود، یعنی توسعه هوش مصنوعی برای منفعت بشر، منحرف شده و در مسیر سودآوری شرکت حرکت کرده‌اند.

OpenAI نیز در اوایل ماه جاری به‌صورت متقابل از ماسک شکایت کرد و او را به آزار مستمر و تلاش برای برهم زدن روند تبدیل شرکت به یک مدل انتفاعی متهم کرد. دادگاه این پرونده قرار است در بهار سال آینده برگزار شود.

در صورت تحقق این ایده، شبکه اجتماعی OpenAI می‌تواند رقابت مستقیمی با شرکت متا (فیسبوک) نیز داشته باشد؛ شرکتی که گفته می‌شود خود در حال توسعه یک سرویس هوش مصنوعی مستقل است. هر دو شرکت متا و X با تکیه بر حجم عظیم داده‌های کاربران، مدل‌های هوش مصنوعی خود را آموزش می‌دهند.

سرمایه ‌گذاری ۲۰۰ میلیون دلاری برای توسعه ربات‌های جراح

یک شرکت انگلیسی تجهیزات پزشکی موفق شده است تا بودجه‌ای را به مبلغ ۲۰۰ میلیون دلار برای توسعه ربات‌های جراح خود در سراسر آمریکا دریافت کند.

شرکت «سی‌ام‌آر سرجیکال»(CMR Surgical) اعلام کرده که دور تامین مالی خود را با بیش از ۲۰۰ میلیون دلار از طریق ترکیب سهام و سرمایه بسته است. این شرکت گفت که جراحان تاکنون از ربات جراح آن موسوم به «ورسیوس»(Versius) برای تکمیل بیش از ۳۰ هزار مورد جراحی در بیش از ۳۰ کشور استفاده کرده‌اند.

«ماسیمیلیانو کوللا»(Massimiliano Colella)، مدیرعامل سی‌ام‌آر سرجیکال گفت: سی‌ام‌آر سرجیکال یک شرکت رقابتی و تثبیت‌شده با محصولی متحول‌کننده است که ارزش بالینی آشکاری دارد. ما اکنون در یک مرحله کلیدی هستیم و آماده‌ایم تا از فرصت‌های قابل توجه برای گسترش بازار خود به کشورهایی از جمله آمریکا و سرمایه‌گذاری در آنها استفاده کنیم و در عین حال، به نفوذ عمیق‌تر به بازارهای کنونی ادامه دهیم.

سی‌ام‌آر سرجیکال که در سال ۲۰۱۴ تأسیس شد، با جراحان و شرکای بیمارستانی کار کرده است تا رباتی را ارائه دهد که جراحی را در دسترس‌تر و مقرون به صرفه‌تر کند. به گفته این شرکت مستقر در کمبریج، ربات ورسیوس طراحی جمع‌وجوری دارد و همچنین، قابل حمل است و تقریبا در همه اتاق‌های عمل قرار می‌گیرد.

ورسیوس با تقلید از بازوی انسان به جراحان امکان می‌دهد تا محل قرارگیری پورت را تنظیم کنند. به گفته سی‌ام‌آر سرجیکال، این ربات مهارت و دقت فناوری‌های کوچک را ارائه می‌دهد. این ربات به جراحان امکان می‌دهد تا فقط از بازوهای مورد نیاز برای یک روش خاص استفاده کنند و برای ادغام در جریان کار موجود طراحی شده است.

مقامات سی‌ام‌آر سرجیکال گفتند: کنسول جراحی باز سیستم با دید سه‌بعدی HD، کنترل تطبیقی و انتخاب موقعیت‌های کاری در بدن می‌تواند استرس و خستگی را کاهش دهد. همچنین، امکان ارتباط آشکار با گروه جراحی را فراهم می‌کند.

هوش مصنوعی هنوز در تشخیص ساعت و تقویم مشکل دارد

پژوهشی تازه نشان می‌دهد که بسیاری از هوش‌های مصنوعی پیشرفته هنوز در تشخیص زمان از روی ساعت‌های آنالوگ و درک تاریخ‌ها در تقویم‌ها دچار مشکل‌اند.

بر اساس مطالعه‌ای جدید، برخی از پیشرفته‌ترین سامانه‌های هوش مصنوعی جهان در درک زمان از روی ساعت‌ها و تشخیص تاریخ‌ها در تقویم‌ها ناتوان هستند.

این در حالی است که این مدل‌ها می‌توانند وظایف پیچیده‌ای مانند نوشتن مقاله یا تولید آثار هنری را انجام دهند، اما هنوز در مهارت‌هایی که انسان‌ها به‌سادگی از عهده‌شان برمی‌آیند، دچار ضعف‌اند.

تیمی از دانشگاه ادینبرو نشان داده‌ است که مدل‌های پیشرفته‌ی هوش مصنوعی قادر نیستند به‌درستی موقعیت عقربه‌های ساعت را تفسیر کنند یا به پرسش‌هایی درباره‌ی تاریخ‌ها در تقویم پاسخ دقیق بدهند.

دانشمندان می‌گویند برخلاف تشخیص ساده‌ی اشکال، درک ساعت‌های آنالوگ و تقویم‌ها نیازمند ترکیبی از مهارت‌های فضایی، درک زمینه و ریاضیات پایه است؛ مواردی که همچنان برای سامانه‌های هوش مصنوعی چالش‌برانگیزند.

گفته می‌شود که اگر این چالش‌ها برطرف شوند، سامانه‌های هوش مصنوعی می‌توانند نقش مؤثری در کاربردهای وابسته به زمان مانند دستیارهای زمان‌بندی، ربات‌های خودکار و ابزارهای کمکی برای افراد دارای اختلال بینایی ایفا کنند.

برای بررسی این موضوع، پژوهشگران مدل‌های هوش مصنوعی چندوجهی (Multimodal Large Language Models یا MLLMs) را که توانایی پردازش متن و تصویر را دارند، در مواجهه با تصاویری از ساعت یا تقویم آزمایش کردند تا ببینند آیا می‌توانند به پرسش‌های مرتبط با زمان پاسخ دهند یا نه.

در این آزمایش، ساعت‌های مختلفی مورد استفاده قرار گرفت؛ از جمله ساعت‌هایی با اعداد رومی، بدون عقربه ثانیه‌شمار، و با صفحه‌های رنگی متنوع. یافته‌ها نشان داد که در بهترین حالت، سامانه‌های هوش مصنوعی موقعیت عقربه‌ها را کمتر از یک‌چهارم مواقع درست تشخیص داده‌اند.

گفتنی است این اشتباه‌ها زمانی بیشتر می‌شد که ساعت‌ها دارای اعداد رومی یا عقربه‌های تزئینی بودند. حتی حذف عقربه ثانیه‌شمار نیز عملکرد مدل‌ها را بهبود نداد، که به گفته‌ی تیم پژوهشی، نشان‌دهنده‌ی مشکلات اساسی در تشخیص عقربه‌ها و تفسیر زاویه‌هاست.

پژوهشگران همچنین از این مدل‌ها خواستند به پرسش‌هایی در مورد تقویم پاسخ دهند، مانند تشخیص تعطیلات یا محاسبه تاریخ‌های گذشته و آینده. نتایج نشان داد حتی بهترین مدل نیز در یک‌پنجم موارد در محاسبه تاریخ‌ها اشتباه کرده است.

این یافته‌ها در مقاله‌ای که مورد داوری علمی قرار گرفته، منتشر شده و قرار است در کارگاه «استدلال و برنامه‌ریزی برای مدل‌های زبانی بزرگ» در سیزدهمین کنفرانس بین‌المللی بازنمایی‌های یادگیری (ICLR) در سنگاپور در تاریخ ۲۸ آوریل ۲۰۲۵ ارائه شود.

رهبر این پژوهش، روهیت ساکسنا از دانشکده انفورماتیک دانشگاه ادینبرو، می‌گوید: «اکثر مردم از سنین پایین می‌توانند ساعت بخوانند و از تقویم استفاده کنند. یافته‌های ما نشان‌دهنده‌ی شکاف قابل‌توجهی در توانایی هوش مصنوعی برای انجام مهارت‌هایی است که برای انسان‌ها بسیار پایه‌ای تلقی می‌شود. اگر بخواهیم این سامانه‌ها را به‌درستی در کاربردهای واقعی و حساس به زمان مانند زمان‌بندی، اتوماسیون و فناوری‌های کمکی ادغام کنیم، این کمبودها باید برطرف شوند.»

آریو جما، دیگر پژوهشگر این تیم نیز در پایان می‌افزاید: «در حالی که تحقیقات امروز در حوزه‌ی هوش مصنوعی اغلب بر وظایف پیچیده‌ تمرکز دارد، به طرز جالبی بسیاری از سامانه‌ها هنوز در کارهای ساده و روزمره ناتوان هستند.

یافته‌های ما نشان می‌دهد که وقت آن رسیده این خلأهای بنیادی را جدی بگیریم؛ وگرنه ممکن است کاربردهای عملی هوش مصنوعی همیشه در لحظه آخر گیر کنند!»

قابلیت جدید هوش مصنوعی مولد آمازون

«آمازون» مدل هوش مصنوعی مولد ویدئوی خود را با قابلیت تولید ویدئوهای تا دو دقیقه ارتقاء داده است.

«نوا ریل»(Nova Reel) که در دسامبر ۲۰۲۴ معرفی شد، اولین ورود شرکت «آمازون»(Amazon) به فضای هوش مصنوعی مولد ویدئو بود. در بازاری که به سرعت در حال شلوغ شدن است، نوا ریل با مدل‌های هوش مصنوعی شرکت‌هایی مانند «اوپن‌ای‌آی»(OpenAI) و «گوگل» رقابت می‌کند.

«الیزابت فوئنتس»(Elizabeth Fuentes)، توسعه‌دهنده خدمات وب آمازون در یک پست وبلاگ توضیح داد که جدیدترین مدل نوا ریل موسوم به «نوا ریل ۱.۱» می‌تواند ویدئوهای چند شات را با سبک ثابت تولید کند. کاربران می‌توانند یک درخواست با حداکثر ۴۰۰۰ کاراکتر را برای تولید یک ویدئوی دو دقیقه‌ای متشکل از شات‌های ۶ ثانیه‌ای ارائه کنند.

نوا ریل ۱.۱ یک حالت جدید به نام «Multishot Manual» را نیز معرفی می‌کند. در این حالت، مدل می‌تواند یک تصویر را به همراه یک اعلان ارائه دهد تا کنترل بیشتری را بر ترکیب یک عکس ویدئویی فراهم کند. با توجه به تصویری با وضوح ۱۲۸۰ در ۷۲۰ و درخواست حداکثر ۵۱۲ کاراکتر، Multishot Manual می‌تواند ویدئوهایی با حداکثر ۲۰ عکس تولید کند.

نوا ریل فقط از طریق پلتفرم‌ها و خدمات وب آمازون از جمله «Bedrock» - مجموعه توسعه‌دهندگان هوش مصنوعی آمازون - در دسترس است و مشتریان باید درخواست دسترسی داشته باشند. مانند بیشتر سیستم‌های هوش مصنوعی مولد، پرسش‌هایی وجود دارد مبنی بر این که آیا نوا ریل با استفاده از روش‌های اخلاقی درست توسعه داده شده است یا خیر.

مدل‌های تولید ویدئو روی تعداد زیادی نمونه به‌دست‌آمده از ویدئوها آموزش داده شده‌اند تا الگوهای موجود در این ویدئوها را برای تولید ویدئوهای جدید یاد بگیرند. برخی از شرکت‌ها بدون کسب اجازه از صاحبان یا سازندگان، مدل‌هایی را روی ویدئوهای دارای حق نسخه‌برداری آموزش می‌دهند و زمانی که این مدل‌ها عکس‌های دارای حق نسخه‌برداری را بازمی‌گردانند، کاربران مدل‌ها در معرض شکایت‌های IP قرار می‌گیرند.

آمازون منبع داده‌های آموزشی نوا ریل را فاش نکرده و روش صریحی را برای سازندگانی که احتمالا مجموعه داده‌های مدل‌ها را با ویدئوهای خود تغذیه می‌کنند، ارائه نکرده است. با وجود این، آمازون گفته است که از هر مشتری متهم به نقض حق نسخه‌برداری از محتوای تولیدشده توسط مدل‌ها، مطابق با خط مشی غرامت خود محافظت می‌کند.

رمزنگاری غیرقابل نفوذ: هوش مصنوعی و هولوگرام‌ها، داده‌ها را غیرقابل شکست می‌کنند

این تلاش می‌تواند راه را برای توسعه‌ سیستم‌هایی هموار کند که رمزنگاری را به سطحی بی‌سابقه از امنیت می‌رسانند.

ترکیب هوش مصنوعی با رمزنگاری هولوگرافیک، راه را برای توسعه‌ یک سیستم محافظت از داده‌ها با امنیتی فوق‌العاده بالا هموار کرده است.

در این روش، پرتوهای لیزر به الگوهایی کاملاً آشفته و غیرقابل پیش‌بینی تبدیل می‌شوند، به‌گونه‌ای که رمزگشایی آن‌ها بدون استفاده از شبکه عصبی آموزش‌دیده غیرممکن خواهد بود. این نوآوری می‌تواند انقلابی در عرصه‌ی رمزنگاری دیجیتال ایجاد کند.

با رشد فزاینده‌ نیاز به امنیت اطلاعات، پژوهشگران سیستمی نوری طراحی کرده‌اند که اطلاعات را به‌صورت هولوگرام رمزگذاری می‌کند؛ شیوه‌ای که روش‌های سنتی رمزنگاری قادر به نفوذ در آن نیستند. این پیشرفت می‌تواند مسیر ارتباطات امن‌تری را فراهم کند و در حفاظت از داده‌های حساس، نقش حیاتی ایفا نماید.

استلیوس تسورتزاکیس (رهبر تیم تحقیقاتی از مؤسسه ساختار الکترونیکی و لیزر، وابسته به بنیاد پژوهش و فناوری یونان و دانشگاه کرت) می‌گوید: «از ارزهای دیجیتال گرفته تا مدیریت، سلامت، ارتباطات و شبکه‌های اجتماعی، نیاز به سیستم‌های محافظتی قدرتمند برای مقابله با تقلب دیجیتال همواره در حال افزایش است.».

وی می‌افزاید: «سیستم جدید ما با بهره‌گیری از شبکه عصبی، کلید رمزگشایی را تولید می‌کند؛ کلیدی که تنها توسط صاحب سیستم رمزنگاری قابل تولید است».

در مقاله‌ای که در نشریه‌ Optica، وابسته به گروه انتشاراتی Optica منتشر شده، تسورتزاکیس و همکارانش توضیح می‌دهند که چگونه سیستم طراحی‌شده از شبکه‌های عصبی برای رمزگشایی اطلاعات پیچیده‌ ذخیره‌شده به‌صورت هولوگرام بهره می‌برد.

آن‌ها نشان دادند که شبکه‌های عصبی آموزش‌دیده می‌توانند اطلاعات فضایی در تصاویر درهم‌ریخته را با دقت بالا بازسازی کنند.

به گفته‌ی تسورتزاکیس، «مطالعه‌ ما پایه‌ای قدرتمند برای کاربردهای متعدد، به‌ویژه در رمزنگاری و ارتباطات نوری بی‌سیم امن، ایجاد کرده و راه را برای فناوری‌های نسل آینده در مخابرات باز می‌کند. روش ما حتی در شرایط سخت و غیرقابل پیش‌بینی، از جمله آب‌و‌هوای نامناسب که اغلب عملکرد سیستم‌های نوری در فضای آزاد را محدود می‌کند، قابل اعتماد است.»

پژوهشگران این روش جدید را زمانی طراحی کردند که دریافتند استفاده از هولوگرام برای رمزگذاری پرتو لیزر، موجب درهم‌ریختگی کامل و تصادفی آن می‌شود، به‌طوری‌که شکل اولیه‌ی پرتو از نظر فیزیکی قابل تشخیص یا بازسازی نیست. آن‌ها به این نتیجه رسیدند که این پدیده می‌تواند ابزاری عالی برای رمزنگاری ایمن اطلاعات باشد.

تسورتزاکیس می‌گوید: «چالش اصلی، یافتن راهی برای رمزگشایی اطلاعات بود. ایده‌مان این بود که شبکه‌های عصبی را آموزش دهیم تا جزئیات بسیار دقیق الگوهای نوری آشفته را تشخیص دهند. با ایجاد میلیاردها ارتباط پیچیده در درون این شبکه‌ها، توانستیم شکل اصلی پرتوهای نوری را بازسازی کنیم. این بدان معنا بود که می‌توانیم کلید رمزگشایی‌ای بسازیم که برای هر پیکربندی سیستم رمزنگاری خاص و منحصر‌به‌فرد باشد».

گفتنی است برای ساخت سیستمی فیزیکی که پرتوهای نوری را به‌طور کامل و آشفته پراکنده کند، پژوهشگران از لیزری قدرتمند استفاده کردند که با محفظه‌ای کوچک پر از الکل اتانول تعامل می‌کرد.

این مایع ارزان‌قیمت، آشفتگی موردنظر را تنها در فاصله‌ای چند میلی‌متری ایجاد می‌کرد. علاوه بر تغییر شدت پرتو، تعامل نور با مایع باعث ایجاد اغتشاشات حرارتی نیز می‌شد که خود باعث افزایش شدت آشفتگی در الگوهای نوری می‌شد.

تیم پژوهشی برای اثبات کارایی این روش، از آن برای رمزگذاری و رمزگشایی هزاران تصویر دست‌نویس از ارقام، اشکال ستاره‌ای، حیوانات، ابزارها و اشیای روزمره استفاده کردند.

این داده‌ها از پایگاه‌های معتبری گرفته شده بودند که برای ارزیابی عملکرد سیستم‌های بازیابی تصویر به کار می‌روند. پس از بهینه‌سازی روند آزمایش و آموزش شبکه عصبی، پژوهشگران توانستند با دقتی بین ۹۰ تا ۹۵ درصد، تصاویر رمزگذاری‌شده را بازسازی کنند. به گفته‌ی آن‌ها، این دقت با آموزش بیشتر شبکه عصبی می‌تواند حتی بیشتر شود.

پژوهشگران قصد دارند در گام بعدی، سطوح حفاظتی بیشتری مانند احراز هویت دو مرحله‌ای به سیستم اضافه کنند. همچنین، از آنجا که بزرگ‌ترین مانع تجاری‌سازی این فناوری، هزینه و اندازه سیستم‌های لیزر قدرتمند است، آن‌ها در حال بررسی جایگزین‌های کم‌هزینه‌تر و کوچک‌تر برای این نوع لیزرها هستند.

هشدار مایکروسافت: استفاده از هوش مصنوعی کاربران را کم‌هوش‌تر می‌کند

مطالعه‌ای جدید هشدار می‌دهد که هوش مصنوعی می‌تواند توانایی تفکر انتقادی کاربران را تضعیف و در واقع آن‌ها را کم‌هوش‌تر کند.

این تحقیق‌ــ که مایکروسافت و دانشگاه کارنگی ملون به‌صورت نظرسنجی از کارکنان حوزه‌های تجارت، آموزش، هنر، مدیریت و رایانه انجام داده‌اند‌ــ نشان داده است کسانی که به درستی و دقت پاسخ‌های دستیارهای هوش مصنوعی بیشترین اعتماد را دارند، کمتر درباره صحت نتایج ارائه‌شده به‌صورت انتقادی فکر می‌کنند.

این یافته چندان غافلگیرکننده نیست، اما دامی پنهان در رشد روزافزون حضور هوش مصنوعی در زندگی ما را آشکار می‌کند: هرچه ابزارهای یادگیری ماشینی اعتماد بیشتری جلب کنند، احتمال تولید محتوای نادرست و خطرناکی که از نگاه کاربران پنهان می‌ماند بیشتر می‌شود.

پژوهشگران در این مطالعه نوشتند: «در صورت استفاده نادرست، فناوری‌ها می‌توانند به زوال توانایی‌های شناختی منجر شوند.»

آن‌ها در ادامه افزودند: «یکی از تناقض‌های اصلی این است که با ماشینی کردن وظایف تکراری و سپردن موارد استثنایی به کاربر انسانی، فرصت‌های مکرر برای تمرین قضاوت و تقویت ذهن را از او می‌گیرید و در نتیجه کاربر در مواجهه با استثناها، ناتوان و بدون آمادگی باقی می‌ماند.»

از پاسخ‌دهندگان، که از مددکار اجتماعی تا برنامه‌نویس را شامل می‌شدند، خواسته شد سه نمونه از کاربرد ابزارهای مولد هوش مصنوعی مانند چت‌جی‌پی‌تی در شغل خود را توضیح دهند. سپس، از آن‌ها پرسیده شد که در انجام این وظایف از تفکر انتقادی استفاده کرده‌اند یا نه و اگر بله، چگونه. همچنین از آن‌ها درباره میزان تلاش لازم برای انجام همان وظیفه بدون استفاده از هوش مصنوعی و میزان اعتمادشان به نتیجه نهایی سوال شد.

نتایج نشان داد که بررسی انتقادی پاسخ‌های هوش مصنوعی به‌شدت کاهش یافته است؛ به‌طوری‌ که شرکت‌کنندگان اعلام کردند در ۴۰ درصد از وظایفشان هیچ‌گونه تفکر انتقادی به کار نبرده‌اند.

این تنها نشانه‌ای نیست که به آثار زیان‌بار وابستگی دیجیتال بر توانایی‌های شناختی انسان اشاره دارد. مطالعات دیگر نشان داده‌اند کاربران چت‌جی‌پی‌تی به حدی به آن وابسته می‌شوند که دوری از این ابزار هوش مصنوعی می‌تواند علائم مشابه ترک اعتیاد ایجاد کند. همچنین، ویدئوهای کوتاه مانند آنچه در تیک‌تاک دیده می‌شود موجب کاهش دامنه توجه و تضعیف رشد شبکه‌های عصبی مرتبط با پردازش اطلاعات و کنترل اجرایی می‌شوند.

این مشکلات بیشتر میان جوانان دیده می‌شود، گروهی که بیشترین میزان استفاده از هوش مصنوعی را دارند و اغلب از آن برای نوشتن مقاله و فرار از فرایند استدلال استفاده می‌کنند.

البته این پدیده جدیدی نیست‌ــ «اثر گوگل» که در آن کاربران اطلاعات را به موتور جست‌وجو واگذار می‌کنند، سال‌ها است که شناخته شده است‌ــ اما این تحقیق بار دیگر اهمیت احتیاط در واگذاری کارهای ذهنی به ماشین‌هایی را که مستعد خطا هستند گوشزد می‌کند؛ زیرا ممکن است در نهایت توانایی انجام آن کارها را به‌کلی از دست بدهیم.

پژوهشگران نوشتند: «داده‌ها نشان‌دهنده تغییر در میزان تلاش شناختی‌اند، به‌ گونه‌ای که کارکنان حوزه دانش با استفاده از هوش مصنوعی مولد بیشتر از اجرا به نظارت بر وظایف گرایش پیدا می‌کنند.»

آن‌ها در ادامه افزودند: «در حالی که هوش مصنوعی می‌تواند بهره‌وری را افزایش دهد، ممکن است مشارکت انتقادی را کاهش دهد، به‌ویژه در وظایف روزمره یا کم‌اهمیت که کاربران صرفا به هوش مصنوعی تکیه می‌کنند، و این مسئله نگرانی‌هایی در مورد وابستگی بلندمدت و کاهش توانایی حل مسئله مستقل ایجاد می‌کند.»

عضلات مصنوعی در خدمت سرکوب لرزش‌های حرکتی

دانشمندان با ساخت بازویی زیستی-رباتیکی مجهز به عضلات مصنوعی، گامی مهم در سرکوب لرزش‌های غیرارادی بیماران پارکینسون برداشته‌اند و امید تازه‌ای برای طراحی پوشیدنی‌های کمکی ایجاد کرده‌اند.

برآوردها نشان می‌دهند که حدود ۸۰ میلیون نفر در سراسر جهان با نوعی لرزش غیرارادی زندگی می‌کنند؛ برای مثال، بسیاری از مبتلایان به بیماری پارکینسون.

این حرکات ناآگاهانه و دوره‌ای می‌توانند به‌شدت توانایی انجام فعالیت‌های روزمره مانند نوشیدن از لیوان یا نوشتن را تحت تأثیر قرار دهند. در این میان، دستگاه‌های پوشیدنی رباتیک نرم به عنوان راه‌حلی بالقوه برای سرکوب این لرزش‌ها مطرح شده‌اند.

با این حال، نمونه‌های اولیه موجود هنوز به اندازه‌ای پیشرفته نیستند که بتوانند راه‌حلی واقعی و مؤثر ارائه دهند.

دانشمندان مؤسسه ماکس پلانک برای سامانه‌های هوشمند (MPI-IS)، دانشگاه توبینگن و دانشگاه اشتوتگارت که تحت همکاری مشترک BITS (هوش زیستی توبینگن-اشتوتگارت) فعالیت می‌کنند، قصد دارند این وضعیت را تغییر دهند.

تیم تحقیقاتی آن‌ها بازویی زیستی-رباتیکی را طراحی کرده که دو رشته عضله مصنوعی سبک‌وزن در امتداد ساعد آن قرار گرفته است.

گفتنی است این بازو که به آن لقب «بیمار مکانیکی» داده‌اند، قادر است لرزش‌های واقعی بیماران را شبیه‌سازی کند. برای این منظور، لرزش چند بیمار ثبت شده و سپس به بازوی رباتیک منتقل شده تا حرکات دست و مچ به‌طور واقعی بازسازی شود.

اما زمانی که سامانه‌ی سرکوب لرزش فعال می‌شود، عضلات مصنوعی از جنس عملگرهای الکترو-هیدرولیکی منقبض و منبسط شده و به‌گونه‌ای عمل می‌کنند که حرکت رفت‌وبرگشتی ناشی از لرزش را جبران کنند. در نتیجه، لرزش تقریباً دیگر قابل احساس یا مشاهده نیست.

این بازو دو هدف را دنبال می‌کند: نخست، به عنوان بستری برای آزمایش ایده‌های جدید در زمینه اسکلت‌های خارجی کمکی، در اختیار سایر پژوهشگران قرار می‌گیرد.

به کمک شبیه‌سازی‌های زیست‌مکانیکی رایانه‌ای، پژوهشگران می‌توانند بدون نیاز به آزمایش‌های پرهزینه و زمان‌بر بالینی، عملکرد عضلات مصنوعی نرم را ارزیابی کنند—حتی در کشورهایی که انجام این آزمایش‌ها روی بیماران واقعی از نظر قانونی ممکن نیست.

شایان ذکر است این بازو همچنین محملی برای آزمودن عضلات مصنوعی‌ای است که توسط دپارتمان مواد رباتیک در مؤسسه ماکس پلانک توسعه یافته‌اند. این عضلات که با نام HASEL شناخته می‌شوند، در طی سال‌ها به‌طور قابل توجهی بهبود یافته‌اند.

دیدگاه تیم تحقیقاتی آن است که این عضلات در آینده پایه و اساس دستگاه‌های پوشیدنی کمکی شوند تا افراد مبتلا به لرزش بتوانند با آسودگی بیشتری فعالیت‌های روزمره‌ خود را انجام دهند، مثلاً فنجانی را در دست بگیرند.

آلونا شاگان شمرون، پژوهشگر پسادکتری در دپارتمان مواد رباتیک و نویسنده اصلی مقاله منتشرشده در مجله Device، می‌گوید: «ما پتانسیل بالایی برای استفاده از این عضلات در طراحی لباس‌هایی می‌بینیم که فرد بتواند آن را به‌شکلی کاملاً نامحسوس بپوشد، به‌طوری‌که دیگران حتی متوجه لرزش او نشوند.»

وی می‌افزاید: «ما نشان دادیم که عضلات مصنوعی ما که مبتنی بر فناوری HASEL هستند، از سرعت و قدرت کافی برای مقابله با دامنه‌ وسیعی از لرزش‌های مچ دست برخوردارند.»

دنیل هوفله، استاد مؤسسه هر‌تی برای تحقیقات بالینی مغز در دانشگاه توبینگن و از اعضای تیم تحقیقاتی نیز می‌گوید: «ترکیب بیمار مکانیکی با مدل‌های زیست‌مکانیکی به ما امکان می‌دهد که بسنجیم آیا عضلات مصنوعی توانایی سرکوب انواع لرزش‌ها، حتی شدیدترین آن‌ها را دارند یا خیر.

در نتیجه، اگر روزی دستگاهی پوشیدنی طراحی شود، می‌توان آن را به‌طور اختصاصی با ویژگی‌های لرزش هر بیمار تنظیم کرد.»

گفته می‌شود که این بیمار مکانیکی ابزاری کلیدی در شناسایی قابلیت‌های فناوری‌های جدید در مراحل ابتدایی توسعه است، آن‌ هم بدون نیاز به آزمایش‌های بالینی پرهزینه.

استاد زین اشمیت از دانشگاه اشتوتگارت می‌گوید: «ایده‌های خوبی در حوزه فناوری پزشکی اغلب به مرحله اجرا نمی‌رسند، زیرا آزمایش‌های بالینی در مراحل اولیه بسیار دشوار و گران هستند. این مدل مکانیکی راه‌حلی مؤثر برای این مشکل است.»

در پایان، کریستف کپ‌لینگر، مدیر دپارتمان مواد رباتیک در MPI-IS خاطرنشان می‌کند: «رباتیک ظرفیت بالایی برای تحول در حوزه سلامت دارد. این پروژه موفق، نقش کلیدی سامانه‌های رباتیک نرم و انعطاف‌پذیر را به‌خوبی به نمایش می‌گذارد.»

پایان عصر پسوردها؟ پس‌کی‌ها و آینده احراز هویت دیجیتال

پس‌کی‌ها یک گام بزرگ به سمت دنیایی بدون رمز عبور هستند. آنها امنیت و راحتی بیشتری را فراهم می‌آورند، اما هنوز به پذیرش گسترده‌تری نیاز دارند. در آینده، با گسترش این فناوری، رمزهای عبور ممکن است به‌طور کامل حذف شوند و جای خود را به پس‌کی‌ها بدهند.

همه ما این تجربه را داشته‌ایم: تلاش برای ورود به یک حساب کاربری با رمز عبور (پس‌ورد) و دریافت پیام «رمز عبور نادرست است». پس از چند تلاش ناموفق، حساب قفل می‌شود و باید فرآیند پیچیده بازیابی رمز را طی کنیم. این مشکلات باعث شده‌اند که روش‌های جدید و ایمن‌تری مانند پس‌کی (Passkey) جایگزین رمزهای عبور سنتی شوند.

پس‌کی چیست؟
پس‌کی جایگزینی امن و ساده برای رمزهای عبور است که از ویژگی‌های امنیتی داخلی دستگاه (مانند اثر انگشت، Face ID یا PIN) استفاده می‌کند. برخلاف رمزهای عبور، پس‌کی‌ها روی دستگاه ذخیره می‌شوند و هیچ اطلاعاتی روی سرورهای شرکت‌ها باقی نمی‌ماند، که خطر نشت داده‌ها را کاهش می‌دهد.

چرا به پس‌کی نیاز داریم؟
تحقیقات نشان می‌دهد که رایج‌ترین رمز عبور همچنان "123456" است که امنیت بسیار پایینی دارد. پس‌کی‌ها با استفاده از رمزنگاری کلید عمومی، امنیت بیشتری را فراهم می‌کنند و کاربران را از حملات فیشینگ، سرقت اطلاعات و نشت داده‌ها محافظت می‌کنند.

پس‌کی‌ها چگونه کار می‌کنند؟
این فناوری بخشی از استاندارد FIDO2 است و از مکانیزم‌های احراز هویت مبتنی بر کلید عمومی استفاده می‌کند. فرآیند ایجاد یک پس‌کی شامل سه مرحله است:
1. کاربر درخواست ایجاد پس‌کی را در وب‌سایت یا اپلیکیشن ارسال می‌کند.
2. دستگاه یک جفت کلید خصوصی/عمومی تولید و کلید خصوصی را در یک محیط امن (مانند TPM یا iCloud Keychain) ذخیره می‌کند.
3. در ورودهای بعدی، دستگاه کاربر چالشی را امضا کرده و با ارسال کلید عمومی به سرور، هویت وی تأیید می‌شود.

پس‌کی‌ها در چه سایت‌هایی قابل استفاده هستند؟
در حال حاضر، بسیاری از شرکت‌های بزرگ از جمله گوگل، اپل، آمازون، مایکروسافت، گیت‌هاب، اوبر، نینتندو، پلی‌استیشن، و دراپ‌باکس از پس‌کی پشتیبانی می‌کنند. برخی بانک‌ها نیز این فناوری را پذیرفته‌اند، اما هنوز فاصله زیادی با پذیرش کامل در حوزه مالی وجود دارد.

مزایای پس‌کی در مقایسه با رمز عبور و مدیر رمز عبور
ابزارهای مدیریت رمز عبور مانند 1Password، Dashlane و Bitwarden گزینه‌های خوبی هستند، اما همچنان متکی به ذخیره رمزهای عبور روی سرورهایشان هستند. در مقابل، پس‌کی‌ها از ارسال و ذخیره رمز در فضای آنلاین جلوگیری می‌کنند، که باعث می‌شود در برابر حملات هکری ایمن‌تر باشند.

سوالات متداول درباره پس‌کی‌ها

۱. اگر دستگاه خود را گم کنم چه می‌شود؟
پس‌کی‌ها در فضای ابری (مانند iCloud یا Google Password Manager) ذخیره و رمزگذاری می‌شوند و می‌توانند روی دستگاه‌های دیگر بازیابی شوند.
۲. آیا پس‌کی‌ها از فیشینگ جلوگیری می‌کنند؟
بله، چون پس‌کی‌ها اطلاعات ورود را ارسال نمی‌کنند، حتی اگر مهاجم تلاش کند اطلاعات ورود را سرقت کند، هیچ داده‌ای برای سوءاستفاده وجود نخواهد داشت.
۳. آیا می‌توان پس‌کی را به اشتراک گذاشت؟
پس‌کی‌ها به هویت فردی وابسته‌اند، اما در برخی موارد، امکان اشتراک‌گذاری آنها در بین دستگاه‌های متصل به یک حساب وجود دارد.
۴. آیا در همه موارد به پس‌کی نیاز داریم؟
خیر، برای حساب‌های با امنیت پایین (مانند حساب‌های عمومی) یا سیستم‌های قدیمی و سازمانی، هنوز رمزهای عبور ممکن است گزینه مناسبی باشند.

جمع‌بندی
پس‌کی‌ها یک گام بزرگ به سمت دنیایی بدون رمز عبور هستند. آنها امنیت و راحتی بیشتری را فراهم می‌آورند، اما هنوز به پذیرش گسترده‌تری نیاز دارند. در آینده، با گسترش این فناوری، رمزهای عبور ممکن است به‌طور کامل حذف شوند و جای خود را به پس‌کی‌ها بدهند.

پشت پرده کد هوش مصنوعی: افشای سوگیری پنهان سیاسی

مطالعه‌ای جدید نشان می‌دهد که مدل‌های مولد هوش مصنوعی، آن‌قدرها هم که به نظر می‌رسد بی‌طرف نیستند.

مدل هوش مصنوعی «ChatGPT» که به طور گسترده مورد استفاده قرار می‌گیرد، تمایل دارد دیدگاه‌های جناح چپ را در اولویت قرار دهد و در مقابل، از پرداختن به دیدگاه‌های محافظه‌کارانه خودداری ‌کند.

این موضوع نگرانی‌هایی در مورد تأثیر آن بر جامعه ایجاد کرده و بر نیاز فوری به تنظیم مقرراتی برای تضمین بی‌طرفی و توازن در ابزارهای هوش مصنوعی تأکید دارد تا این ابزارها با ارزش‌های دموکراتیک همسو باقی بمانند.

با اینکه هوش مصنوعی مولد با سرعتی چشم‌گیر در حال پیشرفت است، اما مطالعه‌ای در دانشگاه East Anglia هشدار می‌دهد که این فناوری می‌تواند ریسک‌های پنهانی برای اعتماد عمومی و ارزش‌های دموکراتیک به همراه داشته باشد.

این تحقیق که با همکاری محققانی از بنیاد Getulio Vargas و موسسه Insper در برزیل انجام شده، نشان می‌دهد چت‌جی‌پی‌تی در تولید متن و تصویر سوگیری سیاسی دارد و به طور آشکار دیدگاه‌های متمایل به چپ را بازتاب می‌دهد. این یافته‌ها پرسش‌هایی جدی درباره عدالت و پاسخ‌گویی در طراحی سیستم‌های هوش مصنوعی مطرح می‌کند.

پژوهشگران دریافتند که چت‌جی‌پی‌تی اغلب از ورود به بحث پیرامون دیدگاه‌های محافظه‌کارانه رایج اجتناب می‌کند، اما در تولید محتوای متمایل به جناح چپ بسیار فعال است. این عدم توازن در بازنمایی ایدئولوژیک می‌تواند به تحریف گفتمان عمومی و تعمیق شکاف‌های اجتماعی منجر شود.

دکتر فابیو موتوکی (نویسنده اصلی مقاله) با عنوان «ارزیابی سوگیری سیاسی و ناسازگاری ارزشی در هوش مصنوعی زایشی» که در ژورنال Journal of Economic Behavior and Organization منتشر شده، می‌گوید: «یافته‌های ما نشان می‌دهد که ابزارهای هوش مصنوعی مولدبه هیچ‌وجه خنثی نیستند. این سیستم‌ها بازتاب‌دهنده سوگیری‌هایی هستند که ممکن است به‌طور ناخواسته بر درک عمومی و سیاست‌گذاری‌ها تأثیر بگذارند».

گفتنی است سیستم‌هایی مانند چت‌جی‌پی‌تی نحوه تولید، مصرف، تفسیر و توزیع اطلاعات را در حوزه‌های مختلف متحول کرده‌اند. با اینکه نوآورانه‌اند، اما خطر تقویت سوگیری‌های ایدئولوژیک و تأثیرگذاری بر ارزش‌های اجتماعی به شکل‌هایی را دارند که هنوز کاملاً شناخته‌شده یا تحت نظارت نیستند.

دکتر پینیو نتو (استاد اقتصاد در مدرسه EPGE در برزیل و هم‌نویسنده این مقاله) تأکید می‌کند: «سوگیری‌های کنترل‌نشده در سیستم‌های هوش مصنوعی می‌تواند شکاف‌های اجتماعی موجود را عمیق‌تر کرده و اعتماد به نهادها و فرآیندهای دموکراتیک را تضعیف کند».

وی می‌افزاید: «این مطالعه لزوم همکاری میان‌حوزه‌ای بین سیاست‌گذاران، فناوران و دانشگاهیان را نشان می‌دهد تا بتوان سیستم‌های هوش مصنوعی منصفانه، پاسخ‌گو و هم‌راستا با هنجارهای اجتماعی طراحی کرد».

گفتنی است گروه پژوهشی برای ارزیابی جهت‌گیری سیاسی چت‌جی‌پی‌تی از سه روش نوین استفاده کرد که بر پایه تحلیل متن و تصویر با کمک ابزارهای آماری و یادگیری ماشین بود. نخست، با استفاده از پرسش‌نامه استاندارد مرکز پژوهشی Pew، پاسخ‌هایی را شبیه‌سازی کردند که افراد عادی در آمریکا ارائه می‌دهند.

دکتر موتوکی می‌گوید: «با مقایسه پاسخ‌های چت‌جی‌پی‌تی با داده‌های واقعی، انحراف سیستماتیکی به سوی دیدگاه‌های چپ‌گرایانه مشاهده کردیم. همچنین نشان دادیم که افزایش حجم نمونه‌ها می‌تواند خروجی‌های هوش مصنوعی را تثبیت کرده و به یافته‌های باثبات‌تری منجر شود.»

در گام دوم، از چت‌جی‌پی‌تی خواسته شد در موضوعات سیاسی حساس پاسخ‌های آزاد تولید کند. سپس با استفاده از مدل زبانی RoBERTa، محتوای تولیدشده از منظر هم‌سویی با دیدگاه‌های چپ و راست تحلیل شد. مشخص شد چت‌جی‌پی‌تی در بیشتر موارد با ارزش‌های چپ هم‌راستا بوده، اما در موضوعاتی مانند برتری نظامی، گاهی گرایش‌های محافظه‌کارانه نشان داده است.

در مرحله نهایی، توانایی چت‌جی‌پی‌تی در تولید تصویر بررسی شد. از همان موضوعات مرحله متن برای ایجاد تصاویر استفاده شد و خروجی‌ها با GPT-4 Vision و سامانه Gemini گوگل تحلیل شدند.

ویکتور رانگل، دانشجوی کارشناسی ارشد سیاست‌گذاری عمومی در Insper و هم‌نویسنده مقاله می‌گوید: «تولید تصویر نیز بازتاب‌دهنده همان سوگیری‌های متنی بود، اما در برخی موضوعات مانند برابری نژادی و قومی، چت‌جی‌پی‌تی از تولید تصاویر با دیدگاه‌های راست‌گرایانه امتناع کرد و دلیل آن را نگرانی از نشر اطلاعات غلط عنوان کرد، در حالی‌که تصاویر با دیدگاه چپ بدون مشکل تولید شدند».