محمدمهدی خراسانی

توسعه‌دهنده Full-Stack

توسعه‌دهنده نرم‌افزار

توسعه‌دهنده بک‌اند

توسعه‌دهنده اپلیکیشن موبایل

طراح محصول

طراح تجربه کاربری (UX)

طراح رابط کاربری (UI)

طراح وب

طراح گرافیک

تحلیلگر داده

هوش مصنوعی

بینایی ماشین

یادگیری عمیق

یادگیری ماشین

پردازش زبان طبیعی (NLP)

مشاور توسعه سیستم‌های هوش مصنوعی

تحلیلگر تکنیکال بازارهای مالی

مدیر پروژه فناوری اطلاعات

توسعه‌دهنده بلاک‌چین

برنامه نویس میکروکنترلر

نوشته بلاگ

هوش مصنوعی فقط ChatGPT نیست!

فروردین ۱۵, ۱۴۰۴ آموزش, عمومی, فرهنگ, کدنویسی
هوش مصنوعی فقط ChatGPT نیست!

یه زمانی بود ما می‌گفتیم ماشین لرنینگ (یادگیری ماشین)، شبکه عصبی و … حالا همه می‌گن هوش مصنوعی. به خدا هوش مصنوعی با ChatGPT به دنیا نیومد! و به خدا همه‌ی هوش مصنوعی چت‌بات و LLM نیستن! در واقع ظهور چت‌بات‌های قدرتمندی مثل ChatGPT باعث شده خیلی‌ها فکر کنن «هوش مصنوعی» خلاصه شده در همین مدل‌های زبانی بزرگ؛ در حالی که مدل‌های زبانی بزرگ فقط بخش کوچکی از دنیای وسیع هوش مصنوعی هستند. تو این مقاله می‌خوایم ببینیم LLM چیه و چه کاربردی داره و بعدش به زبان ساده با بقیه شاخه‌های مهم AI آشنا بشیم تا معلوم شه هوش مصنوعی واقعاً چیا هست.

مدل‌های زبانی بزرگ (LLM) و بخشی کوچک در AI

مدل زبانی بزرگ که به اختصار LLM گفته می‌شه، یه نوع سیستم هوش مصنوعی‌یه که برای درک و تولید زبان انسانی طراحی شده. این مدل‌ها رو «بزرگ» صدا می‌زنن چون تعداد پارامترهاشون (همون تنظیمات داخلی شبکه عصبی) به میلیاردها می‌رسه و می‌تونن الگوهای پیچیده‌ی زبان رو یاد بگیرن. نتیجه‌ش اینه که LLMها می‌تونن متن‌هایی تولید کنن که در نگاه اول خیلی شبیه متن نوشته‌شده توسط آدمه. مثلا ChatGPT از شرکت OpenAI یکی از بزرگ‌ترین و قوی‌ترین مدل‌های زبانی بزرگه که این روزها اسمش سر زبون‌ها افتاده. مدل‌های معروف دیگه هم هستن مثل Google Gemini از گوگل یا Claude از Anthropic یا Deepseek چینی – که اخیرا هم سر و صدا به پا کرد! – که اونا هم LLM محسوب می‌شن.

LLMها چه کارایی بلدن؟ خیلی کارها! می‌تونن به سوال‌های کاربر جواب بدن، مقاله یا داستان بنویسن، چت کنن، زبان رو ترجمه کنن، یا حتی کد برنامه‌نویسی تولید کنن. برای آموزش این مدل‌ها حجم عظیمی از متن (کتاب، مقاله، صفحات وب و …) رو به خوردشون می‌دن تا کم‌کم روابط و معنی‌ها رو یاد بگیرن. کاربرد عملی‌شون رو احتمالاً خودتون تجربه کردین: از چت‌بات‌هایی مثل ChatGPT که باهاش صحبت می‌کنین گرفته تا مثلاً دستیارهای هوشمند توی بعضی اپلیکیشن‌ها که متن رو خلاصه می‌کنن یا ایمیل پیشنویس می‌کنن. با این حال، هرچند مدل‌های زبانی بزرگ پیشرفته‌ان، اما همه‌ی هوش مصنوعی نیستند. هوش مصنوعی شاخه‌های متنوعی داره که هر کدوم کارهای متفاوتی انجام می‌دن و تاریخچه خودشونو دارن. برای این‌که بهتر تصوّر کنیم، کافیه بدونیم LLM فقط یکی از شاخه‌های یادگیری ماشین و پردازش زبان طبیعی تو هوش مصنوعی به حساب میاد و تازه همه‌ی مسائل AI هم به زبان مربوط نمی‌شه.

در تصویر زیر «نقشه هوش مصنوعی» را می‌بینید که شاخه‌های مختلف این حوزه را نمایش می‌دهد. این نمودار ذهنی به خوبی نشان می‌دهد که حوزه‌هایی نظیر یادگیری ماشین، بینایی کامپیوتر، پردازش زبان، رباتیک، سیستم‌های خبره، و غیره هر کدام شاخه‌ای مجزا از AI هستند و مدل‌های زبانی (مانند ChatGPT) تنها یکی از زیرشاخه‌های یادگیری عمیق در سمت راست تصویر هستند

 

یادگیری ماشین و یادگیری عمیق – قلب تپنده‌ی هوش مصنوعی

یکی از مهم‌ترین شاخه‌های AI که احتمالاً زیاد اسمشو شنیدین یادگیری ماشین (Machine Learning) هست. ایده اصلی یادگیری ماشین اینه که به جای این‌که مستقیم به کامپیوتر بگیم چیکار کنه، خودش با دیدن داده‌ها الگوها رو یاد بگیره. مثلاً به جای این‌که هزاران قانون برای تشخیص اسپم بنویسیم، یک الگوریتم یادگیری ماشین می‌تونه با دیدن کلی ایمیل اسپم و غیراسپم، خودش یاد بگیره چه ایمیل‌هایی اسپمن و چه‌ها اسپم نیستن. در واقع، یادگیری ماشین یعنی ساخت سیستم‌ها یا مدل‌هایی که با استفاده از داده‌ها به مرور زمان عملکردشون بهتر می‌شه.

یادگیری ماشین از همون اوایل تاریخچه هوش مصنوعی مطرح بوده (حتی می‌شه گفت یکی از اولین برنامه‌های موفق AI در دهه ۵۰ یه برنامه ساده‌ی شطرنج یادگیر بود). اما پیشرفت جدی اون از دهه ۱۹۸۰ و ۱۹۹۰ شروع شد و در دهه ۲۰۱۰ با ظهور یادگیری عمیق (Deep Learning) اوج گرفت. یادگیری عمیق در واقع زیرشاخه‌ای از یادگیری ماشینه که از شبکه‌های عصبی چندلایه استفاده می‌کنه؛ شبکه‌هایی الهام‌گرفته از مغز انسان که لایه‌لایه نورون‌های مصنوعی داره. هرچی لایه‌ها بیشتر باشه و داده‌ی بیشتری بهش بدیم، شبکه عمیق‌تر می‌شه و می‌تونه الگوهای خیلی پیچیده رو هم یاد بگیره (برای همین بهش می‌گن «عمیق»). امروز بخش عمده‌ای از موفقیت‌های بزرگ AI مدیون یادگیری عمیق با شبکه‌های عصبیه.

یادگیری ماشین الان تو خیلی از جنبه‌های زندگی ما حضور داره. برخی از کاربردهای مهم یادگیری ماشین عبارتند از:

  • ترجمه ماشینی: مثلا ترجمه‌های خودکار در Google Translate که با هوش مصنوعی انجام می‌شه و کیفیتش در سال‌های اخیر خیلی بهتر شده.
  • پیش‌بینی وضعیت هوا: مدل‌های ML می‌تونن با استفاده از داده‌های ماهواره‌ای و تاریخی، هوای روزهای آینده رو نسبتاً دقیق پیش‌بینی کنن.
  • تشخیص هرزنامه (اسپم): سرویس‌های ایمیل مثل جیمیل با الگوریتم‌های یادگیری ماشین، ایمیل‌های مزاحم رو فیلتر می‌کنن که به صندوق ورودی شما نرسن.
  • تشخیص تقلب مالی: بانک‌ها و شرکت‌های کارت اعتباری با ML تراکنش‌های مشکوک رو شناسایی می‌کنن (مثلاً اگر کارت شما در دو کشور هم‌زمان استفاده شه، هشدار می‌ده).
  • شبکه‌های اجتماعی: پلتفرم‌هایی مثل اینستاگرام یا توییتر با الگوریتم‌های یادگیرنده تعیین می‌کنن چه پست‌ها یا توییت‌هایی رو به شما نشون بدن تا بیشتر براتون جالب باشه.
  • تشخیص بیماری و پزشکی: از ML برای تحلیل تصاویر پزشکی (مانند عکس رادیولوژی یا MRI) و تشخیص تومورها یا پیش‌بینی ریسک بیماری‌ها استفاده می‌شه.

همون‌طور که می‌بینین یادگیری ماشین یک ابزار همه‌کاره‌ست؛ از فیلتر کردن ایمیل گرفته تا تشخیص چهره و توصیه فیلم، همه جا کاربرد داره. خیلی از شرکت‌های بزرگ فناوری اساس کارشون رو ML گذاشتن. گوگل تو موتور جست‌وجوش از الگوریتم‌های یادگیری ماشین مثل RankBrain استفاده کرده که نتایج رو بر اساس فهم بهتر منظور کاربر بهبود می‌ده. آمازون برای پیشنهاد دادن کالاهای مرتبط به مشتری‌ها از الگوریتم‌های ML استفاده می‌کنه. اپل وقتی قابلیت‌های Siri (سیری) یا حتی Face ID رو توسعه می‌ده، داره از یادگیری ماشین بهره می‌بره. به طور خلاصه، یادگیری ماشین ستون فقرات خیلی از سیستم‌های هوشمند امروزیه.

یک نقطه عطف مهم در تاریخ یادگیری ماشین و به‌خصوص یادگیری عمیق، سال ۲۰۱۲ بود. در این سال یک شبکه عصبی عمیق به نام AlexNet در یک مسابقه‌ی تشخیص تصویر به اسم ImageNet، رکورد شکست و با اختلاف زیادی بهتر از بقیه عمل کرد. اون مسابقه نشون داد که شبکه‌های عمیق می‌تونن بینایی کامپیوتر رو متحول کنن (که در بخش بعد بهش می‌پردازیم). بعد از اون، موجی از موفقیت‌های یادگیری عمیق تو کارهای مختلف به راه افتاد که باعث شد شرکت‌ها و دانشگاه‌ها سرمایه‌گذاری عظیمی روی این روش‌ها بکنن.

پردازش زبان طبیعی – از ترجمه تا تجزیه احساسات

پردازش زبان طبیعی (Natural Language Processing یا NLP) شاخه‌ای از AIه که هدفش اینه کامپیوترها بتونن زبان انسان رو درست بفهمن و تولید کنن. مدل‌های زبانی بزرگ مثل ChatGPT که بالاتر گفتیم، خودشون جزئی از پیشرفت‌های همین حوزه‌ان. اما NLP فقط ChatGPT نیست. مثلاً سیری در آیفون یا دستیار گوگل (Google Assistant) رو در نظر بگیرین؛ این‌ها باید صدای شمارو تبدیل به متن کنن، متن رو بفهمن چی می‌خواین، جواب مناسب رو به زبان طبیعی تولید کنن و اگر لازم باشه دوباره به صدا تبدیل کنن. همه این مراحل، مسائل اصلی NLP و همچنین تشخیص گفتار رو در بر می‌گیره.

یکی از کاربردهای قدیمی و خیلی پراستفاده‌ی پردازش زبان، ترجمه ماشینیه. حتماً یادتونه حدود یکی دو دهه پیش ترجمه‌های کامپیوتری چقدر خنده‌دار و ناشیانه بودن. اون موقع بیشتر از روش‌های مبتنی بر قواعد دست‌نویس یا آماری ساده استفاده می‌شد. ولی امروز به لطف مدل‌های یادگیری عمیق در NLP (مثل مدل‌های ترنسفورمر که پایه Google Translate امروزی هستن)، کیفیت ترجمه‌ها خیلی بالا رفته. مثلا ترجمه انگلیسی به فارسی گوگل یا برعکس، حالا دیگه اغلب جملات قابل فهم و درست ترجمه می‌شن، چیزی که ۱۰ سال پیش یک رویا بود.

یکی دیگه از وظایف جالب NLP تحلیل احساسات تو متنه؛ یعنی مثلاً یک برنامه بتونه تشخیص بده یک نقد یا توییت لحنش مثبته یا منفی. شرکت‌ها از این فناوری استفاده می‌کنن تا بازخورد مشتری‌هاشونو بسنجن. یا فیسبوک و توییتر هم برای پیدا کردن پست‌های توهین‌آمیز یا خشونت‌بار از چنین ابزارهایی بهره می‌برن که متن رو بررسی می‌کنه و علامت‌گذاری می‌کنه.

چت‌بات‌ها هم بخشی از NLP هستن. البته نسل جدید چت‌بات‌ها مثل ChatGPT کاملاً مبتنی بر یادگیری عمیق‌ان، اما قبل از اون‌ها هم چت‌بات‌های ساده‌تری داشتیم. شاید شنیده باشین که در دهه ۱۹۶۰ اولین چت‌بات به اسم ELIZA ساخته شد که نقش یک روانکاو رو بازی می‌کرد و با چند الگوی ساده‌ی متنی، وانمود می‌کرد داره باهاتون همدلی می‌کنه! اون یک مثال اولیه از پردازش زبان مبتنی بر قوانین بود. بعدها چت‌بات‌های پیشرفته‌تری هم اومدن که در خدمات مشتریان شرکت‌ها به کار می‌رفتن و بر اساس یک سری سناریوی از پیش تعریف شده پاسخ می‌دادن.

امروز با ترکیب تشخیص گفتار و پردازش زبان طبیعی، دستیارهای صوتی قدرتمندی داریم. الکسای آمازون رو در نظر بگیرین که می‌تونه ازتون فرمان صوتی بگیره و مثلاً چراغ‌های خونه رو خاموش کنه یا آهنگ پخش کنه. این سیستم باید صدای محیط شمارو به خوبی تشخیص بده (NLP + پردازش صوت) و بفهمه منظور شما چیه. خوشبختانه دقت تشخیص گفتار در سال‌های اخیر به حدی رسیده که بعضی سیستم‌ها به دقتی نزدیک انسان دست پیدا کردن (مثلاً مایکروسافت در ۲۰۱۷ اعلام کرد که سیستم تشخیص گفتارش در یک آزمون به پای دقت انسان رسیده). این یعنی پیشرفتی فوق‌العاده در شاخه‌ی پردازش زبان و گفتار که زندگی روزمره‌مونو راحت‌تر کرده.

بینایی ماشین (Computer Vision) – وقتی کامپیوترها می‌بینند

یکی دیگه از شاخه‌های جذاب هوش مصنوعی بینایی ماشین یا بینایی کامپیوتره که تلاش می‌کنه کامپیوترها بتونن دنیای بصری رو درک کنن. یعنی چی؟ یعنی مثلا بتونن تو یه عکس یا ویدیو تشخیص بدن چه چیزهایی وجود داره: این یه گربه‌ست یا سگیه؟ چند نفر تو تصویرن؟ پلاک این ماشین چنده؟ آیا این تصویر یک تومور رو در عکس MRI نشون می‌ده یا نه؟ تمام اینا مسائلی هستن که بینایی ماشین باهاش سر و کار داره.

بینایی ماشین تاریخچه جالبی داره. از همون اوایل AI در دهه ۶۰ میلادی، دانشمندها دوست داشتن کامپیوترها بتونن ببینن. ولی سال‌ها این پیشرفت خیلی کند بود چون درک تصویر واقعاً کار سختیه (مغز ما میلیون‌ها سال تکامل داشته تا چشممون اطلاعات رو پردازش کنه!). تا مدت‌ها الگوریتم‌های بینایی ماشین محدود بودن و مثلاً فقط می‌تونستن لبه‌های اجسام رو تو عکس تشخیص بدن یا الگوهای ساده رو پیدا کنن. نقطه عطف بزرگ همونطور که بالا اشاره کردیم، سال ۲۰۱۲ اتفاق افتاد که یک شبکه عصبی عمیق تونست در تشخیص اشیا در تصاویر به طرز شگفت‌آوری بهتر از روش‌های قدیمی عمل کنه. از اون به بعد، تقریباً تمام رکوردهای تشخیص تصویر، تشخیص چهره و… با شبکه‌های عصبی جدید جابه‌جا شد.

کاربردهای بینایی ماشین امروز خیلی گسترده‌ست. چند تا مثال ملموس:

  • تشخیص چهره: دوربین گوشی‌های هوشمند (مثل Face ID در آیفون) از AI برای شناسایی چهره شما استفاده می‌کنن که قفل گوشی باز شه. یا فیسبوک و گوگل فوتوز هم وقتی عکس آپلود می‌کنین چهره دوستان رو تشخیص می‌دن و پیشنهاد تگ می‌دهند.
  • خودروهای خودران: ماشین‌های خودران مثل محصولات تسلا یا پروژه Waymo گوگل، پر از دوربین و سنسورن. این خودروها با استفاده از بینایی ماشین محیط اطرافشونو می‌بینن – مثلا خطوط جاده، عابر پیاده، تابلوهای راهنما و بقیه ماشین‌ها رو تشخیص می‌دهند – و بعد هوش مصنوعی تصمیم می‌گیره چجوری رانندگی کنه. همین الان هم بسیاری از ماشین‌های جدید دارای سیستم‌های کمک‌راننده مثل ترمز اضطراری خودکار یا کروز کنترل هوشمند هستند که با دوربین جلو، ماشین جلویی رو تشخیص می‌دن و سرعت رو تنظیم می‌کنن.
  • پزشکی: AI در بینایی ماشین به پزشکا کمک می‌کنه سریع‌تر و دقیق‌تر تشخیص بدن. برای مثال، الگوریتم‌های بینایی می‌تونن تصاویر رادیولوژی یا اسکن رو آنالیز کنن و موارد مشکوک به سرطان یا بیماری‌های دیگه رو علامت بزنن تا پزشک بررسی کنه. در برخی آزمایش‌ها حتی دقت این سیستم‌ها با متخصصان انسانی برابری کرده.
  • نظارت و امنیت: تو دوربین‌های مداربسته پیشرفته، AI می‌تونه افراد یا اشیاء خاصی رو ردیابی کنه. مثلا در فرودگاه‌ها یک سیستم نظارتی هوشمند می‌تونه چهره افراد تحت تعقیب رو در ویدیوهای زنده تشخیص بده و هشدار بده.
  • فیلترها و واقعیت افزوده: حتماً با فیلترهای بامزه اینستاگرام یا اسنپ‌چت بازی کردین که روی صورتتون عینک یا سبیل می‌ذاره. این هم نوعی بینایی ماشینه که اجزای صورت رو تشخیص می‌ده و گرافیک رو درست جاگذاری می‌کنه.

بینایی ماشین به قدری مهمه که شرکت‌های بزرگ سرمایه‌گذاری سنگینی روش کردن. گوگل یه پایگاه داده عظیم به نام Google Images و ابزار جستجوی تصویری داره که از تکنیک‌های AI بهره می‌بره. مایکروسافت و آمازون سرویس‌های پردازش تصویر ابری ارائه دادن که توسعه‌دهنده‌ها می‌تونن تو برنامه‌هاشون استفاده کنن (مثل تشخیص صحنه‌ی عکس یا شناختن متن داخل تصویر). حتی در اینستاگرام هم الگوریتم‌هایی کار می‌کنن که تصاویر نامناسب رو تشخیص بدن و پاک کنن یا برعکس بفهمن علایق بصری شما چیه و مشابه همون‌ها رو بهتون پیشنهاد بدن.

رباتیک و سیستم‌های خودران – هوش مصنوعی در دنیای فیزیکی

وقتی حرف از هوش مصنوعی می‌شه، شاید تصویر ربات‌های انسان‌نما تو ذهن خیلی‌ها بیاد. واقعیت اینه که رباتیک (Robotics) یک شاخه مهم و جدا از AI محسوب می‌شه، ولی این دو حوزه خیلی به هم نزدیکن. رباتیک بیشتر درباره ساخت ربات‌های فیزیکی و مکانیک و کنترل اوناست، در حالی که AI درباره هوشمند کردن رفتار اون ربات‌هاست. ترکیب این دو می‌شه چیزی که در خودروهای خودران یا ربات‌های پیشرفته می‌بینیم: یک ماشین که هم توانایی حرکت و انجام کار داره، هم تصمیم‌گیری هوشمند.

تاریخ رباتیک و AI تقریبا هم‌عصره. اولین ربات‌های متصل به هوش مصنوعی در دهه ۱۹۶۰ توسعه پیدا کردن. مثلاً ربات معروف Shakey (شیکی) که در سال ۱۹۶۶ در موسسه استنفورد ساخته شد، از اولین ربات‌هایی بود که می‌تونست محیط اطرافشو تا حدی درک کنه و بر اساس دستورات، حرکت کنه. از اون زمان تا الان ربات‌ها پیشرفت زیادی داشتن: در صنعت، سال‌هاست که بازوهای رباتیک در کارخونه‌های خودروسازی، کار جوشکاری و مونتاژ رو انجام می‌دن. اون ربات‌ها هرچند خیلی دقیق و قوی‌ان، اما «باهوش» نیستن و معمولاً برنامه ثابتی دارن. با ورود AI، ربات‌ها دارن انعطاف‌پذیرتر و هوشمندتر می‌شن.

یک نمونه جذاب، روبات‌های کمپانی Boston Dynamics هستن که شاید ویدیوهاشون رو دیده باشین؛ ربات‌های سگ‌مانند یا انسان‌نمایی که می‌دونن چطور بدوند، بپرند یا تعادل خودشونو حفظ کنن. این ربات‌ها از ترکیب حسگرها (برای بینایی و تعادل) و الگوریتم‌های هوشمند بهره می‌برن تا حرکاتشون رو با محیط تطبیق بدن. مثلا وقتی هلشون بدی نمی‌افتن، چون AI تصمیم می‌گیره چطور پاشونو بذارن که تعادل برگرده.

اما ملموس‌ترین نمونه ادغام رباتیک و هوش مصنوعی، همون ماشین‌های خودران هست که بالاتر اشاره کردیم. یه خودروی خودران در واقع یک ربات چهارچرخ بزرگه! این ربات باید ببینه (حس‌هایی مثل دوربین و رادار اطراف رو اسکن می‌کنن)، فکر کنه (با AI تحلیل کنه که الآن یه عابر داره رد می‌شه، اون جلو ترافیکه، سرعت مجازه فلانه، پس باید ترمز کنه یا سبقت بگیره) و عمل کنه (پدال و فرمان رو کنترل کنه). شرکت تسلا صراحتاً اعلام کرده که برای رسیدن به رانندگی خودکار کامل، تنها راه، استفاده از هوش مصنوعی پیشرفته در بینایی و برنامه‌ریزی مسیره. تسلا برای سامانه Autopilot خودش شبکه‌های عصبی عمیق تربیت کرده که فقط با دوربین (بدون نیاز به لیزرهای گرون‌قیمت) محیط رو درک کنن و ماشین رو هدایت کنن. همچنین تسلا یک ربات انسان‌نما به نام Optimus هم در دست توسعه داره که هدفش انجام کارهای تکراری و خطرناک به جای انسان‌هاست. این ربات هم مغزش قراره همون شبکه‌های عصبی و هوش مصنوعی باشه که درک محیط و تصمیم‌گیری می‌کنه.

از ربات‌های مشهور دیگه می‌شه به روبات‌های صنعتی خودمختار اشاره کرد که در انبارهای آمازون هزاران تای اون‌ها مشغول جابه‌جا کردن قفسه‌ها و بسته‌ها هستن تا کالاها سریع به دست مشتری برسه. یا پهپادهای خودران که مثلاً برای بررسی خطوط لوله نفت یا تحویل بسته‌ها (پروژه آزمایشی آمازون پرایم ایر) به کار می‌رن. همه اینها ترکیبی از سخت‌افزار رباتیک و الگوریتم‌های AI هستن که به دستگاه قابلیت خودمختاری می‌ده. خودمختار بودن یعنی بدون نیاز به اپراتور انسانی، وظیفه‌شو انجام بده.

در ایران هم حوزه رباتیک هوشمند بی‌نصیب نبوده؛ از پهپادهای پیشرفته گرفته تا ربات‌های آموزشی دانشگاه‌ها که در مسابقات بین‌المللی ربوکاپ شرکت می‌کنن، همه نشون‌دهنده گسترش این شاخه‌ست. خلاصه این‌که AI وقتی با رباتیک ترکیب شه، به ماشین‌ها جان می‌ده تا تو دنیای واقعی برامون کار کنن، از رانندگی و نظافت گرفته تا کار در معادن یا مأموریت‌های فضایی.

سیستم‌های خبره و هوش نمادین – قدیمی‌های باهوش

قبل از اینکه یادگیری ماشین و شبکه عصبی اینقدر مطرح بشه، یه رویکرد دیگه در هوش مصنوعی خیلی محبوب بود به اسم سیستم‌های خبره (Expert Systems). سیستم خبره یعنی سیستمی که دانش و قوانین یک “خبره” (انسان متخصص) رو داخل خودش داره و می‌تونه مثل اون تصمیم بگیره. مثلا تصور کنین یه برنامه کامپیوتری داشته باشیم که مثل یک پزشک باتجربه بتونه از روی علائم بیمار تشخیص بده چه بیماری‌ای داره. برای ساخت چنین برنامه‌ای، تو دهه‌های ۷۰ و ۸۰ میلادی دانشمندها اومدن کلی قاعده If-Then توش نوشتن؛ مثلاً “اگه تب بالای ۳۸ درجه و سرفه شدید، آنگاه احتمالاً ذات‌الریه”. به این ترتیب یه پایگاه دانش از قوانین ایجاد می‌کردن و برنامه می‌تونست با پرسیدن سوالاتی از کاربر، به نتیجه برسه. اولین سیستم‌های خبره در اوایل دهه ۱۹۷۰ ساخته شدن و تا دهه ۱۹۸۰ این حوزه به اوج خودش رسید.

یکی از اولین سیستم‌های خبره‌ی موفق، MYCIN بود که در سال ۱۹۷۴ در دانشگاه استنفورد توسعه داده شد و برای تشخیص عفونت‌های خون و تجویز آنتی‌بیوتیک به کار می‌رفت. MYCIN در آزمایش‌ها تونست به خوبی پزشکان متخصص عمل کنه و نشون داد چنین چیزی شدنیه. بعد از اون سیستم‌های خبره در حوزه‌های دیگه هم ساخته شدن: از تشخیص بیماری‌های گیاهان گرفته تا مشاوره مالی. یک نمونه مشهور دیگه XCON بود که شرکت DEC در دهه ۸۰ برای پیکربندی خودکار کامپیوترهای سفارشی ساخت؛ این سیستم با داشتن قوانین تخصصی تونست میلیون‌ها دلار برای شرکت صرفه‌جویی کنه.

ویژگی سیستم‌های خبره اینه که قوانین و دانش به صورت صریح توی اون‌ها کدنویسی شده. به این رویکرد گاهی می‌گن هوش مصنوعی نمادین (Symbolic AI) چون دانش به شکل نمادها و قواعد منطقی در میاد. مزیت این روش اینه که آدم می‌فهمه چرا سیستم یه تصمیمی گرفت (چون قوانینش معلومه). ولی عیبش اینه که تهیه اون قوانین خیلی سخته و زمان‌بره و سیستم در مواجهه با شرایط جدید که قانون براش نداره، عاجز می‌مونه.

امروزه با اومدن یادگیری ماشین، از سیستم‌های خبره کلاسیک کمتر استفاده می‌شه، چون ML می‌تونه خودش از داده قانون رو کشف کنه. ولی هنوز هم هوش نمادین کاملاً کنار گذاشته نشده. ترکیب رویکردهای مبتنی بر دانش صریح با یادگیری ماشین خیلی مورد توجهه. حتی ChatGPT که یه مدل زبانیه، پشت صحنه یه دانش‌نامه بزرگ (ویکی‌پدیا و … که خونده) تو مغزش داره؛ ولی نمی‌تونه مثل سیستم خبره توضیح بده چرا جوابی رو داده، چون دانشش به صورت کد مشخص نیست. در کاربردهای حساس (مثل پزشکی یا حقوق)، بعضی‌ها ترجیح می‌دن هنوز از سیستم‌های خبره یا حداقل سیستم‌های AI قابل توضیح (Explainable AI) استفاده کنن که بشه دلایل تصمیم رو ردیابی کرد.

سیستم‌های توصیه‌گر – راهنمای انتخاب در زندگی دیجیتال

تقریباً همه ما هر روز با سیستم‌های توصیه‌گر (Recommender Systems) سر و کار داریم، حتی اگه اسمشون به گوشمون نخورده باشه. وقتی توی فیلیمو یه سریال رو تموم می‌کنین و سیستم چند تا سریال دیگه رو پیشنهاد می‌ده که شاید دوست داشته باشین – این کار یه الگوریتم توصیه‌گره. وقتی دیجیکالا زیر یک محصول می‌گه “خریداران این کالا، فلان کالا را هم خریده‌اند”، باز هم یک سیستم توصیه‌گر داره پیشنهاد می‌ده. حتی اینستاگرام که تصمیم می‌گیره چه پست‌هایی رو تو صفحه اکسپلور به شما نشون بده، یا یوتیوب که ویدیوهای بعدی رو ردیف می‌کنه، همه از همین تکنیک‌ها استفاده می‌کنن.

سیستم توصیه‌گر معمولاً بر پایه یادگیری ماشین بنا شده اما به قدری مهمه که به عنوان یک شاخه خاص مورد توجه قرار گرفته. انواع روش‌های توصیه وجود داره: بعضی‌ها مبتنی بر تشابه محتوا هستن (مثلاً فیلم‌های ژانر کمدی مشابه این فیلم)، بعضی‌ها مبتنی بر تشابه کاربران (کسایی که سلیقه‌شون شبیه شما بوده این فیلم رو دوست داشتن). روش مدرن ترکیبی از هر دو و حتی استفاده از شبکه‌های عصبی عمیق برای درک بهتر علایق پنهان کاربره. برای مثال، نتفلیکس اعلام کرده الگوریتمش یک سیستم هیبرید (ترکیبی)‌ه که چندین مدل مختلف رو با هم ترکیب می‌کنه تا دقیق‌ترین پیشنهاد رو بده.

تاریخچه جالبی هم داره: اوایل دهه ۲۰۰۰ آمازون از اولین پیشروان این حوزه بود و متوجه شد با پیشنهاد دادن اقلام مرتبط می‌تونه فروششو زیاد کنه. سال ۲۰۰۶ نتفلیکس یک چالش معروف برگزار کرد و جایزه بزرگ گذاشت برای تیمی که بتونه دقت توصیه فیلم‌هاشو حداقل ۱۰٪ بهبود بده. اون رقابت باعث پیشرفت زیادی در الگوریتم‌های توصیه‌گر شد. حالا دیگه توصیه‌گرها انقدر قوی شدن که طبق آمارها ۸۰٪ از محتوایی که مردم در نتفلیکس تماشا می‌کنن بر اساس پیشنهاد سیستم بوده! این نشون می‌ده الگوریتم چقدر خوب سلیقه شما رو می‌شناسه.

از اونجایی که امروزه با حجم عظیمی از انتخاب‌ها مواجهیم (صدها فیلم، هزاران آهنگ، میلیون‌ها محصول)، سیستم‌های توصیه‌گر یه جورایی قطب‌نمای ما در دنیای دیجیتال شدن. البته نگرانی‌هایی هم هست؛ مثلا اینکه این الگوریتم‌ها حباب سلیقه ایجاد کنن (شما رو فقط در محدوده علاقه‌ی قبلی خودتون نگه دارن و تنوع رو کم کنن) یا توصیه‌های جهت‌دار بدن. اما در کل، جزء جدایی‌ناپذیر تجربه آنلاین فعلی‌ان و نمونه‌ای عملی از هوش مصنوعی که خیلی بی‌سروصدا داره کار خودشو می‌کنه.

سایر رویکردهای هوش مصنوعی – از منطق فازی تا هوش ازدحامی

علاوه بر شاخه‌های مشهوری که گفتیم، هوش مصنوعی شامل یه سری تکنیک‌ها و زیرشاخه‌های تخصصی دیگه هم هست که بد نیست با نامشون آشنا بشیم:

  • منطق فازی (Fuzzy Logic): این رویکرد رو پروفسور لطفی زاده (دانشمند ایرانی‌تبار) تو دهه ۶۰ میلادی مطرح کرد. ایده اصلیش اینه که برخلاف منطق کلاسیک که همه چیز صفر یا یک، بله یا خیر هست، در منطق فازی درجاتی از درستی داریم (مثلا می‌تونیم بگیم امروز هوا “نسبتاً گرم” است). این منطق برای کامپیوترها مفیده تا با مفاهیم مبهم دنیای واقعی کنار بیان. ژاپنی‌ها اولین کسایی بودن که به طور گسترده تو وسایل کاربردی ازش استفاده کردن. مثلا تهویه‌ مطبوع‌های هوشمند که اوایل دهه ۹۰ در ژاپن عرضه شدن با منطق فازی کار می‌کردن؛ اون‌ها به جای اینکه کمپرسور رو یا کاملاً خاموش یا روشن کنن، کم‌کم دور موتور رو کم یا زیاد می‌کنن تا دما یکنواخت‌تر کنترل بشه و مصرف برق کمتر شه. یا یک نمونه جالب‌تر: قطار زیرزمینی سندای در ژاپن اولین قطاری بود که با منطق فازی ترمزهاشو کنترل می‌کرد و گزارش شد حرکتش نرم‌تر شده و ۱۰٪ صرفه‌جویی انرژی داشته. منطق فازی حتی با سیستم‌های خبره ترکیب شد و در صنایع (مثلاً کوره‌های سیمان) به کار رفت. امروزه اگرچه یادگیری ماشین غالب شده، اما منطق فازی هنوز در سیستم‌های کنترل و بعضی محصولات الکترونیک کاربرد داره.
  • الگوریتم‌های تکاملی (Evolutionary Algorithms): این‌ها الهام‌گرفته از نظریه تکامل در زیست‌شناسی هستن. مثلا الگوریتم ژنتیکی رو در نظر بگیرین که مجموعه‌ای از جواب‌های ممکن برای یک مسئله رو مثل جمعیت موجودات در نظر می‌گیره و بعد تولیدمثل و جهش روی اونا انجام می‌ده تا نسل به نسل جواب‌ها بهتر شن! این روش برای حل مسائل بهینه‌سازی که راه‌حل دقیقشون سخت پیدا می‌شه خیلی به کار میاد. یک مثال معروف: ناسا در دهه ۹۰ با الگوریتم ژنتیکی طراحی آنتن فضاپیما رو بهینه کرد و به شکل‌های عجیب اما کارایی رسید که با روش مهندسی معمولی بدست نمی‌اومد. الگوریتم‌های تکاملی در صنعت برای طراحی قطعات، زمان‌بندی کارها یا حتی آموزش شبکه‌های عصبی هم استفاده شدن. مثلا گفته می‌شه شرکت دیپ‌مایند (متعلق به گوگل) برای بهبود بعضی از مدل‌های یادگیری عمیقش از جستجوی تکاملی استفاده کرده.
  • هوش ازدحامی (Swarm Intelligence): در طبیعت دیدین مورچه‌ها چطور با همکاری هم بهترین مسیر رو به غذا پیدا می‌کنن یا زنبورها چطور تصمیم می‌گیرن کندوی جدید کجا باشه؟ الگوریتم‌هایی مثل بهینه‌سازی مورچگان یا بهینه‌سازی ازدحام ذرات از همین رفتار جمعی الهام می‌گیرن. در بهینه‌سازی مورچگان (ACO)، یک سری مورچه مجازی مسیرهای مختلف حل یک مسئله (مثلا کوتاه‌ترین مسیر تحویل کالا بین چند شهر) رو امتحان می‌کنن و فرایند تقویت و تبخیر فرومون رو شبیه‌سازی می‌کنن تا کم‌کم بهترین مسیر مشخص بشه. نتیجه اینه که می‌شه مسائل پیچیده مسیر‌یابی یا زمان‌بندی رو با تقریب خوبی حل کرد. شرکت‌ها برای بهینه‌سازی شبکه حمل و نقل، جریان ترافیک شهری یا حتی چینش ترانزیستورهای یک تراشه از این روش‌ها بهره بردن. هوش ازدحامی یه نمونه جالب دیگه‌ش دسته‌ای از پهپادهاست که با الگوریتمی شبیه زنبورها بدون برخورد با هم پروازهای گروهی انجام می‌دن.
  • محاسبات شناختی (Cognitive Computing): این اصطلاح رو بیشتر آی‌بی‌ام با سیستم Watson سر زبون‌ها انداخت. منظور سیستم‌هاییه که سعی می‌کنن شبیه فرآیندهای فکری انسان عمل کنن، مثلاً ترکیب تحلیل زبان، بینایی، داده‌های زمینه و حتی حس‌های دیگه برای درک متن_context و معنی. واتسون IBM تو سال ۲۰۱۱ تو مسابقه اطلاعات عمومی Jeopardy! قهرمان‌های انسان رو شکست داد و نشون داد ترکیب شاخه‌های مختلف AI می‌تونه نتایج جالبی بده. امروز هم از مفهوم رایانش شناختی تو برنامه‌های مشاوره پزشکی استفاده می‌شه؛ یعنی سیستم‌هایی که مقالات پزشکی رو می‌خونن، سوابق بیمار رو درنظر می‌گیرن و به دکتر پیشنهاد درمان می‌دن. این شاخه‌ایه که یه مقدار بین‌رشته‌ای محسوب می‌شه و شاید تعریف دقیقشم سخت باشه، اما کلیتش ترکیب چندین تکنیک AI برای رسیدن به تصمیمات شبیه انسانه.

موارد بالا تنها چند نمونه بود. شاخه‌های دیگه مثل تحلیل داده و داده‌کاوی (که نزدیک به یادگیری ماشینه)، نمایش دانش و منطق (که به سیستم‌های خبره مرتبطه) و حتی موضوعات فلسفی‌تر مثل هوش مصنوعی عمومی (AGI) هم وجود دارن که هر کدوم دنیای خودشونو دارن. اما فکر کنم برای یک دید کلی، همین‌هایی که گفتیم کفایت می‌کنه.

دنیایی گسترده فراتر از یک چت‌بات

همون‌طور که دیدیم، هوش مصنوعی یه دنیای پهناوره با تاریخچه‌ای پر از فراز و نشیب. از سال ۱۹۵۶ که هوش مصنوعی به عنوان یک رشته علمی متولد شد تا امروز، چندین موج پیشرفت داشتیم؛ یه زمان سیستم‌های خبره مد بودن، یه زمان شبکه‌های عصبی، حالا هم مدل‌های زبانی بزرگ. هر کدوم از این موج‌ها یه سری دستاورد به همراه آوردن. مثلاً سال ۱۹۹۷ برای همیشه تو خاطره‌ها موند چون کامپیوتر IBM دیپ‌بلو تونست برای اولین بار قهرمان شطرنج جهان، گری کاسپاروف رو شکست بده – اتفاقی که نشون داد هوش مصنوعی می‌تونه در بازی‌ای مثل شطرنج از انسان جلو بزنه. بعدش در سال ۲۰۱۶ هوش مصنوعی آلفاگو از شرکت دیپ‌مایند تونست قهرمان بازی پیچیده‌ی گو یعنی لی سدول کره‌ای رو ۴-۱ شکست بده. اینا رو گفتم که تأکید کنم هوش مصنوعی فقط چت‌بات خوش‌صحبت نیست؛ تو مغز ربات‌ها، تو دوربین ماشین‌ها، تو موتور جست‌وجوها، همه جا هست.

برای یک علاقه‌مند غیرمتخصص، شاید همه این مباحث فنی به نظر بیان. ولی نکته دلگرم‌کننده اینه که لازم نیست ریاضی‌دان یا برنامه‌نویس باشیم تا قدر AI رو بدونیم. همین الانش هم AI داره زندگی‌مونو راحت‌تر می‌کنه: فیلم و آهنگ مطابق میلمون پیشنهاد می‌ده، عکس‌های گوشیمونو خودش دسته‌بندی می‌کنه، تایپ می‌کنیم غلطامونو می‌گیره، موقع رانندگی هشدار می‌ده حواسمون نیست و ده‌ها کمک ریز و درشت دیگه. پس دفعه بعد که کسی گفت “هوش مصنوعی مساوی فلان چت‌باته”، می‌تونیم با لبخند بگیم دنیای هوش مصنوعی خیلی بزرگ‌تر و جالب‌تر از این حرف‌هاست!

در یک کلام، هوش مصنوعی یک ابزار همه‌کاره‌ست؛ از گفتگو گرفته تا بینایی، از بازی شطرنج تا رانندگی، هرجا داده باشه و تصمیم، پای AI وسطه. ChatGPT و مدل‌های زبانی بزرگ نشون دادن که چقدر این پیشرفت‌ها می‌تونن جلوی چشم عموم هم بیان و همه رو شگفت‌زده کنن. اما همزمان، نباید تاریخچه و سایر شاخه‌های ریشه‌دار رو فراموش کنیم. این شاخه‌ها مثل تکه‌های یه پازل‌ان که کنار هم تصویر کاملی از مفهوم هوش مصنوعی رو می‌سازن. امیدوارم این مرور دوستانه بهتون کمک کرده باشه که تصویر بزرگ‌تر AI رو ببینین و از گستردگی‌ش لذت ببرین. آینده‌ای که در پیشه احتمالا ترکیبی از همه این تکنیک‌ها رو به کار می‌گیره تا ماشین‌ها رو باهوش‌تر و زندگی ما رو بهتر کنه. پس آشنایی با هر گوشه از این جنگل بزرگ هوش مصنوعی، خالی از لطف نیست!

برچسب ها:
درج دیدگاه