هوش مصنوعی فقط ChatGPT نیست!
یه زمانی بود ما میگفتیم ماشین لرنینگ (یادگیری ماشین)، شبکه عصبی و … حالا همه میگن هوش مصنوعی. به خدا هوش مصنوعی با ChatGPT به دنیا نیومد! و به خدا همهی هوش مصنوعی چتبات و LLM نیستن! در واقع ظهور چتباتهای قدرتمندی مثل ChatGPT باعث شده خیلیها فکر کنن «هوش مصنوعی» خلاصه شده در همین مدلهای زبانی بزرگ؛ در حالی که مدلهای زبانی بزرگ فقط بخش کوچکی از دنیای وسیع هوش مصنوعی هستند. تو این مقاله میخوایم ببینیم LLM چیه و چه کاربردی داره و بعدش به زبان ساده با بقیه شاخههای مهم AI آشنا بشیم تا معلوم شه هوش مصنوعی واقعاً چیا هست.
مدلهای زبانی بزرگ (LLM) و بخشی کوچک در AI
مدل زبانی بزرگ که به اختصار LLM گفته میشه، یه نوع سیستم هوش مصنوعییه که برای درک و تولید زبان انسانی طراحی شده. این مدلها رو «بزرگ» صدا میزنن چون تعداد پارامترهاشون (همون تنظیمات داخلی شبکه عصبی) به میلیاردها میرسه و میتونن الگوهای پیچیدهی زبان رو یاد بگیرن. نتیجهش اینه که LLMها میتونن متنهایی تولید کنن که در نگاه اول خیلی شبیه متن نوشتهشده توسط آدمه. مثلا ChatGPT از شرکت OpenAI یکی از بزرگترین و قویترین مدلهای زبانی بزرگه که این روزها اسمش سر زبونها افتاده. مدلهای معروف دیگه هم هستن مثل Google Gemini از گوگل یا Claude از Anthropic یا Deepseek چینی – که اخیرا هم سر و صدا به پا کرد! – که اونا هم LLM محسوب میشن.
LLMها چه کارایی بلدن؟ خیلی کارها! میتونن به سوالهای کاربر جواب بدن، مقاله یا داستان بنویسن، چت کنن، زبان رو ترجمه کنن، یا حتی کد برنامهنویسی تولید کنن. برای آموزش این مدلها حجم عظیمی از متن (کتاب، مقاله، صفحات وب و …) رو به خوردشون میدن تا کمکم روابط و معنیها رو یاد بگیرن. کاربرد عملیشون رو احتمالاً خودتون تجربه کردین: از چتباتهایی مثل ChatGPT که باهاش صحبت میکنین گرفته تا مثلاً دستیارهای هوشمند توی بعضی اپلیکیشنها که متن رو خلاصه میکنن یا ایمیل پیشنویس میکنن. با این حال، هرچند مدلهای زبانی بزرگ پیشرفتهان، اما همهی هوش مصنوعی نیستند. هوش مصنوعی شاخههای متنوعی داره که هر کدوم کارهای متفاوتی انجام میدن و تاریخچه خودشونو دارن. برای اینکه بهتر تصوّر کنیم، کافیه بدونیم LLM فقط یکی از شاخههای یادگیری ماشین و پردازش زبان طبیعی تو هوش مصنوعی به حساب میاد و تازه همهی مسائل AI هم به زبان مربوط نمیشه.
در تصویر زیر «نقشه هوش مصنوعی» را میبینید که شاخههای مختلف این حوزه را نمایش میدهد. این نمودار ذهنی به خوبی نشان میدهد که حوزههایی نظیر یادگیری ماشین، بینایی کامپیوتر، پردازش زبان، رباتیک، سیستمهای خبره، و غیره هر کدام شاخهای مجزا از AI هستند و مدلهای زبانی (مانند ChatGPT) تنها یکی از زیرشاخههای یادگیری عمیق در سمت راست تصویر هستند

یادگیری ماشین و یادگیری عمیق – قلب تپندهی هوش مصنوعی
یکی از مهمترین شاخههای AI که احتمالاً زیاد اسمشو شنیدین یادگیری ماشین (Machine Learning) هست. ایده اصلی یادگیری ماشین اینه که به جای اینکه مستقیم به کامپیوتر بگیم چیکار کنه، خودش با دیدن دادهها الگوها رو یاد بگیره. مثلاً به جای اینکه هزاران قانون برای تشخیص اسپم بنویسیم، یک الگوریتم یادگیری ماشین میتونه با دیدن کلی ایمیل اسپم و غیراسپم، خودش یاد بگیره چه ایمیلهایی اسپمن و چهها اسپم نیستن. در واقع، یادگیری ماشین یعنی ساخت سیستمها یا مدلهایی که با استفاده از دادهها به مرور زمان عملکردشون بهتر میشه.
یادگیری ماشین از همون اوایل تاریخچه هوش مصنوعی مطرح بوده (حتی میشه گفت یکی از اولین برنامههای موفق AI در دهه ۵۰ یه برنامه سادهی شطرنج یادگیر بود). اما پیشرفت جدی اون از دهه ۱۹۸۰ و ۱۹۹۰ شروع شد و در دهه ۲۰۱۰ با ظهور یادگیری عمیق (Deep Learning) اوج گرفت. یادگیری عمیق در واقع زیرشاخهای از یادگیری ماشینه که از شبکههای عصبی چندلایه استفاده میکنه؛ شبکههایی الهامگرفته از مغز انسان که لایهلایه نورونهای مصنوعی داره. هرچی لایهها بیشتر باشه و دادهی بیشتری بهش بدیم، شبکه عمیقتر میشه و میتونه الگوهای خیلی پیچیده رو هم یاد بگیره (برای همین بهش میگن «عمیق»). امروز بخش عمدهای از موفقیتهای بزرگ AI مدیون یادگیری عمیق با شبکههای عصبیه.
یادگیری ماشین الان تو خیلی از جنبههای زندگی ما حضور داره. برخی از کاربردهای مهم یادگیری ماشین عبارتند از:
- ترجمه ماشینی: مثلا ترجمههای خودکار در Google Translate که با هوش مصنوعی انجام میشه و کیفیتش در سالهای اخیر خیلی بهتر شده.
- پیشبینی وضعیت هوا: مدلهای ML میتونن با استفاده از دادههای ماهوارهای و تاریخی، هوای روزهای آینده رو نسبتاً دقیق پیشبینی کنن.
- تشخیص هرزنامه (اسپم): سرویسهای ایمیل مثل جیمیل با الگوریتمهای یادگیری ماشین، ایمیلهای مزاحم رو فیلتر میکنن که به صندوق ورودی شما نرسن.
- تشخیص تقلب مالی: بانکها و شرکتهای کارت اعتباری با ML تراکنشهای مشکوک رو شناسایی میکنن (مثلاً اگر کارت شما در دو کشور همزمان استفاده شه، هشدار میده).
- شبکههای اجتماعی: پلتفرمهایی مثل اینستاگرام یا توییتر با الگوریتمهای یادگیرنده تعیین میکنن چه پستها یا توییتهایی رو به شما نشون بدن تا بیشتر براتون جالب باشه.
- تشخیص بیماری و پزشکی: از ML برای تحلیل تصاویر پزشکی (مانند عکس رادیولوژی یا MRI) و تشخیص تومورها یا پیشبینی ریسک بیماریها استفاده میشه.
همونطور که میبینین یادگیری ماشین یک ابزار همهکارهست؛ از فیلتر کردن ایمیل گرفته تا تشخیص چهره و توصیه فیلم، همه جا کاربرد داره. خیلی از شرکتهای بزرگ فناوری اساس کارشون رو ML گذاشتن. گوگل تو موتور جستوجوش از الگوریتمهای یادگیری ماشین مثل RankBrain استفاده کرده که نتایج رو بر اساس فهم بهتر منظور کاربر بهبود میده. آمازون برای پیشنهاد دادن کالاهای مرتبط به مشتریها از الگوریتمهای ML استفاده میکنه. اپل وقتی قابلیتهای Siri (سیری) یا حتی Face ID رو توسعه میده، داره از یادگیری ماشین بهره میبره. به طور خلاصه، یادگیری ماشین ستون فقرات خیلی از سیستمهای هوشمند امروزیه.
یک نقطه عطف مهم در تاریخ یادگیری ماشین و بهخصوص یادگیری عمیق، سال ۲۰۱۲ بود. در این سال یک شبکه عصبی عمیق به نام AlexNet در یک مسابقهی تشخیص تصویر به اسم ImageNet، رکورد شکست و با اختلاف زیادی بهتر از بقیه عمل کرد. اون مسابقه نشون داد که شبکههای عمیق میتونن بینایی کامپیوتر رو متحول کنن (که در بخش بعد بهش میپردازیم). بعد از اون، موجی از موفقیتهای یادگیری عمیق تو کارهای مختلف به راه افتاد که باعث شد شرکتها و دانشگاهها سرمایهگذاری عظیمی روی این روشها بکنن.
پردازش زبان طبیعی – از ترجمه تا تجزیه احساسات
پردازش زبان طبیعی (Natural Language Processing یا NLP) شاخهای از AIه که هدفش اینه کامپیوترها بتونن زبان انسان رو درست بفهمن و تولید کنن. مدلهای زبانی بزرگ مثل ChatGPT که بالاتر گفتیم، خودشون جزئی از پیشرفتهای همین حوزهان. اما NLP فقط ChatGPT نیست. مثلاً سیری در آیفون یا دستیار گوگل (Google Assistant) رو در نظر بگیرین؛ اینها باید صدای شمارو تبدیل به متن کنن، متن رو بفهمن چی میخواین، جواب مناسب رو به زبان طبیعی تولید کنن و اگر لازم باشه دوباره به صدا تبدیل کنن. همه این مراحل، مسائل اصلی NLP و همچنین تشخیص گفتار رو در بر میگیره.
یکی از کاربردهای قدیمی و خیلی پراستفادهی پردازش زبان، ترجمه ماشینیه. حتماً یادتونه حدود یکی دو دهه پیش ترجمههای کامپیوتری چقدر خندهدار و ناشیانه بودن. اون موقع بیشتر از روشهای مبتنی بر قواعد دستنویس یا آماری ساده استفاده میشد. ولی امروز به لطف مدلهای یادگیری عمیق در NLP (مثل مدلهای ترنسفورمر که پایه Google Translate امروزی هستن)، کیفیت ترجمهها خیلی بالا رفته. مثلا ترجمه انگلیسی به فارسی گوگل یا برعکس، حالا دیگه اغلب جملات قابل فهم و درست ترجمه میشن، چیزی که ۱۰ سال پیش یک رویا بود.
یکی دیگه از وظایف جالب NLP تحلیل احساسات تو متنه؛ یعنی مثلاً یک برنامه بتونه تشخیص بده یک نقد یا توییت لحنش مثبته یا منفی. شرکتها از این فناوری استفاده میکنن تا بازخورد مشتریهاشونو بسنجن. یا فیسبوک و توییتر هم برای پیدا کردن پستهای توهینآمیز یا خشونتبار از چنین ابزارهایی بهره میبرن که متن رو بررسی میکنه و علامتگذاری میکنه.
چتباتها هم بخشی از NLP هستن. البته نسل جدید چتباتها مثل ChatGPT کاملاً مبتنی بر یادگیری عمیقان، اما قبل از اونها هم چتباتهای سادهتری داشتیم. شاید شنیده باشین که در دهه ۱۹۶۰ اولین چتبات به اسم ELIZA ساخته شد که نقش یک روانکاو رو بازی میکرد و با چند الگوی سادهی متنی، وانمود میکرد داره باهاتون همدلی میکنه! اون یک مثال اولیه از پردازش زبان مبتنی بر قوانین بود. بعدها چتباتهای پیشرفتهتری هم اومدن که در خدمات مشتریان شرکتها به کار میرفتن و بر اساس یک سری سناریوی از پیش تعریف شده پاسخ میدادن.
امروز با ترکیب تشخیص گفتار و پردازش زبان طبیعی، دستیارهای صوتی قدرتمندی داریم. الکسای آمازون رو در نظر بگیرین که میتونه ازتون فرمان صوتی بگیره و مثلاً چراغهای خونه رو خاموش کنه یا آهنگ پخش کنه. این سیستم باید صدای محیط شمارو به خوبی تشخیص بده (NLP + پردازش صوت) و بفهمه منظور شما چیه. خوشبختانه دقت تشخیص گفتار در سالهای اخیر به حدی رسیده که بعضی سیستمها به دقتی نزدیک انسان دست پیدا کردن (مثلاً مایکروسافت در ۲۰۱۷ اعلام کرد که سیستم تشخیص گفتارش در یک آزمون به پای دقت انسان رسیده). این یعنی پیشرفتی فوقالعاده در شاخهی پردازش زبان و گفتار که زندگی روزمرهمونو راحتتر کرده.

بینایی ماشین (Computer Vision) – وقتی کامپیوترها میبینند
یکی دیگه از شاخههای جذاب هوش مصنوعی بینایی ماشین یا بینایی کامپیوتره که تلاش میکنه کامپیوترها بتونن دنیای بصری رو درک کنن. یعنی چی؟ یعنی مثلا بتونن تو یه عکس یا ویدیو تشخیص بدن چه چیزهایی وجود داره: این یه گربهست یا سگیه؟ چند نفر تو تصویرن؟ پلاک این ماشین چنده؟ آیا این تصویر یک تومور رو در عکس MRI نشون میده یا نه؟ تمام اینا مسائلی هستن که بینایی ماشین باهاش سر و کار داره.
بینایی ماشین تاریخچه جالبی داره. از همون اوایل AI در دهه ۶۰ میلادی، دانشمندها دوست داشتن کامپیوترها بتونن ببینن. ولی سالها این پیشرفت خیلی کند بود چون درک تصویر واقعاً کار سختیه (مغز ما میلیونها سال تکامل داشته تا چشممون اطلاعات رو پردازش کنه!). تا مدتها الگوریتمهای بینایی ماشین محدود بودن و مثلاً فقط میتونستن لبههای اجسام رو تو عکس تشخیص بدن یا الگوهای ساده رو پیدا کنن. نقطه عطف بزرگ همونطور که بالا اشاره کردیم، سال ۲۰۱۲ اتفاق افتاد که یک شبکه عصبی عمیق تونست در تشخیص اشیا در تصاویر به طرز شگفتآوری بهتر از روشهای قدیمی عمل کنه. از اون به بعد، تقریباً تمام رکوردهای تشخیص تصویر، تشخیص چهره و… با شبکههای عصبی جدید جابهجا شد.
کاربردهای بینایی ماشین امروز خیلی گستردهست. چند تا مثال ملموس:
- تشخیص چهره: دوربین گوشیهای هوشمند (مثل Face ID در آیفون) از AI برای شناسایی چهره شما استفاده میکنن که قفل گوشی باز شه. یا فیسبوک و گوگل فوتوز هم وقتی عکس آپلود میکنین چهره دوستان رو تشخیص میدن و پیشنهاد تگ میدهند.
- خودروهای خودران: ماشینهای خودران مثل محصولات تسلا یا پروژه Waymo گوگل، پر از دوربین و سنسورن. این خودروها با استفاده از بینایی ماشین محیط اطرافشونو میبینن – مثلا خطوط جاده، عابر پیاده، تابلوهای راهنما و بقیه ماشینها رو تشخیص میدهند – و بعد هوش مصنوعی تصمیم میگیره چجوری رانندگی کنه. همین الان هم بسیاری از ماشینهای جدید دارای سیستمهای کمکراننده مثل ترمز اضطراری خودکار یا کروز کنترل هوشمند هستند که با دوربین جلو، ماشین جلویی رو تشخیص میدن و سرعت رو تنظیم میکنن.
- پزشکی: AI در بینایی ماشین به پزشکا کمک میکنه سریعتر و دقیقتر تشخیص بدن. برای مثال، الگوریتمهای بینایی میتونن تصاویر رادیولوژی یا اسکن رو آنالیز کنن و موارد مشکوک به سرطان یا بیماریهای دیگه رو علامت بزنن تا پزشک بررسی کنه. در برخی آزمایشها حتی دقت این سیستمها با متخصصان انسانی برابری کرده.
- نظارت و امنیت: تو دوربینهای مداربسته پیشرفته، AI میتونه افراد یا اشیاء خاصی رو ردیابی کنه. مثلا در فرودگاهها یک سیستم نظارتی هوشمند میتونه چهره افراد تحت تعقیب رو در ویدیوهای زنده تشخیص بده و هشدار بده.
- فیلترها و واقعیت افزوده: حتماً با فیلترهای بامزه اینستاگرام یا اسنپچت بازی کردین که روی صورتتون عینک یا سبیل میذاره. این هم نوعی بینایی ماشینه که اجزای صورت رو تشخیص میده و گرافیک رو درست جاگذاری میکنه.
بینایی ماشین به قدری مهمه که شرکتهای بزرگ سرمایهگذاری سنگینی روش کردن. گوگل یه پایگاه داده عظیم به نام Google Images و ابزار جستجوی تصویری داره که از تکنیکهای AI بهره میبره. مایکروسافت و آمازون سرویسهای پردازش تصویر ابری ارائه دادن که توسعهدهندهها میتونن تو برنامههاشون استفاده کنن (مثل تشخیص صحنهی عکس یا شناختن متن داخل تصویر). حتی در اینستاگرام هم الگوریتمهایی کار میکنن که تصاویر نامناسب رو تشخیص بدن و پاک کنن یا برعکس بفهمن علایق بصری شما چیه و مشابه همونها رو بهتون پیشنهاد بدن.
رباتیک و سیستمهای خودران – هوش مصنوعی در دنیای فیزیکی
وقتی حرف از هوش مصنوعی میشه، شاید تصویر رباتهای انساننما تو ذهن خیلیها بیاد. واقعیت اینه که رباتیک (Robotics) یک شاخه مهم و جدا از AI محسوب میشه، ولی این دو حوزه خیلی به هم نزدیکن. رباتیک بیشتر درباره ساخت رباتهای فیزیکی و مکانیک و کنترل اوناست، در حالی که AI درباره هوشمند کردن رفتار اون رباتهاست. ترکیب این دو میشه چیزی که در خودروهای خودران یا رباتهای پیشرفته میبینیم: یک ماشین که هم توانایی حرکت و انجام کار داره، هم تصمیمگیری هوشمند.
تاریخ رباتیک و AI تقریبا همعصره. اولین رباتهای متصل به هوش مصنوعی در دهه ۱۹۶۰ توسعه پیدا کردن. مثلاً ربات معروف Shakey (شیکی) که در سال ۱۹۶۶ در موسسه استنفورد ساخته شد، از اولین رباتهایی بود که میتونست محیط اطرافشو تا حدی درک کنه و بر اساس دستورات، حرکت کنه. از اون زمان تا الان رباتها پیشرفت زیادی داشتن: در صنعت، سالهاست که بازوهای رباتیک در کارخونههای خودروسازی، کار جوشکاری و مونتاژ رو انجام میدن. اون رباتها هرچند خیلی دقیق و قویان، اما «باهوش» نیستن و معمولاً برنامه ثابتی دارن. با ورود AI، رباتها دارن انعطافپذیرتر و هوشمندتر میشن.
یک نمونه جذاب، روباتهای کمپانی Boston Dynamics هستن که شاید ویدیوهاشون رو دیده باشین؛ رباتهای سگمانند یا انساننمایی که میدونن چطور بدوند، بپرند یا تعادل خودشونو حفظ کنن. این رباتها از ترکیب حسگرها (برای بینایی و تعادل) و الگوریتمهای هوشمند بهره میبرن تا حرکاتشون رو با محیط تطبیق بدن. مثلا وقتی هلشون بدی نمیافتن، چون AI تصمیم میگیره چطور پاشونو بذارن که تعادل برگرده.
اما ملموسترین نمونه ادغام رباتیک و هوش مصنوعی، همون ماشینهای خودران هست که بالاتر اشاره کردیم. یه خودروی خودران در واقع یک ربات چهارچرخ بزرگه! این ربات باید ببینه (حسهایی مثل دوربین و رادار اطراف رو اسکن میکنن)، فکر کنه (با AI تحلیل کنه که الآن یه عابر داره رد میشه، اون جلو ترافیکه، سرعت مجازه فلانه، پس باید ترمز کنه یا سبقت بگیره) و عمل کنه (پدال و فرمان رو کنترل کنه). شرکت تسلا صراحتاً اعلام کرده که برای رسیدن به رانندگی خودکار کامل، تنها راه، استفاده از هوش مصنوعی پیشرفته در بینایی و برنامهریزی مسیره. تسلا برای سامانه Autopilot خودش شبکههای عصبی عمیق تربیت کرده که فقط با دوربین (بدون نیاز به لیزرهای گرونقیمت) محیط رو درک کنن و ماشین رو هدایت کنن. همچنین تسلا یک ربات انساننما به نام Optimus هم در دست توسعه داره که هدفش انجام کارهای تکراری و خطرناک به جای انسانهاست. این ربات هم مغزش قراره همون شبکههای عصبی و هوش مصنوعی باشه که درک محیط و تصمیمگیری میکنه.
از رباتهای مشهور دیگه میشه به روباتهای صنعتی خودمختار اشاره کرد که در انبارهای آمازون هزاران تای اونها مشغول جابهجا کردن قفسهها و بستهها هستن تا کالاها سریع به دست مشتری برسه. یا پهپادهای خودران که مثلاً برای بررسی خطوط لوله نفت یا تحویل بستهها (پروژه آزمایشی آمازون پرایم ایر) به کار میرن. همه اینها ترکیبی از سختافزار رباتیک و الگوریتمهای AI هستن که به دستگاه قابلیت خودمختاری میده. خودمختار بودن یعنی بدون نیاز به اپراتور انسانی، وظیفهشو انجام بده.
در ایران هم حوزه رباتیک هوشمند بینصیب نبوده؛ از پهپادهای پیشرفته گرفته تا رباتهای آموزشی دانشگاهها که در مسابقات بینالمللی ربوکاپ شرکت میکنن، همه نشوندهنده گسترش این شاخهست. خلاصه اینکه AI وقتی با رباتیک ترکیب شه، به ماشینها جان میده تا تو دنیای واقعی برامون کار کنن، از رانندگی و نظافت گرفته تا کار در معادن یا مأموریتهای فضایی.
سیستمهای خبره و هوش نمادین – قدیمیهای باهوش
قبل از اینکه یادگیری ماشین و شبکه عصبی اینقدر مطرح بشه، یه رویکرد دیگه در هوش مصنوعی خیلی محبوب بود به اسم سیستمهای خبره (Expert Systems). سیستم خبره یعنی سیستمی که دانش و قوانین یک “خبره” (انسان متخصص) رو داخل خودش داره و میتونه مثل اون تصمیم بگیره. مثلا تصور کنین یه برنامه کامپیوتری داشته باشیم که مثل یک پزشک باتجربه بتونه از روی علائم بیمار تشخیص بده چه بیماریای داره. برای ساخت چنین برنامهای، تو دهههای ۷۰ و ۸۰ میلادی دانشمندها اومدن کلی قاعده If-Then توش نوشتن؛ مثلاً “اگه تب بالای ۳۸ درجه و سرفه شدید، آنگاه احتمالاً ذاتالریه”. به این ترتیب یه پایگاه دانش از قوانین ایجاد میکردن و برنامه میتونست با پرسیدن سوالاتی از کاربر، به نتیجه برسه. اولین سیستمهای خبره در اوایل دهه ۱۹۷۰ ساخته شدن و تا دهه ۱۹۸۰ این حوزه به اوج خودش رسید.
یکی از اولین سیستمهای خبرهی موفق، MYCIN بود که در سال ۱۹۷۴ در دانشگاه استنفورد توسعه داده شد و برای تشخیص عفونتهای خون و تجویز آنتیبیوتیک به کار میرفت. MYCIN در آزمایشها تونست به خوبی پزشکان متخصص عمل کنه و نشون داد چنین چیزی شدنیه. بعد از اون سیستمهای خبره در حوزههای دیگه هم ساخته شدن: از تشخیص بیماریهای گیاهان گرفته تا مشاوره مالی. یک نمونه مشهور دیگه XCON بود که شرکت DEC در دهه ۸۰ برای پیکربندی خودکار کامپیوترهای سفارشی ساخت؛ این سیستم با داشتن قوانین تخصصی تونست میلیونها دلار برای شرکت صرفهجویی کنه.
ویژگی سیستمهای خبره اینه که قوانین و دانش به صورت صریح توی اونها کدنویسی شده. به این رویکرد گاهی میگن هوش مصنوعی نمادین (Symbolic AI) چون دانش به شکل نمادها و قواعد منطقی در میاد. مزیت این روش اینه که آدم میفهمه چرا سیستم یه تصمیمی گرفت (چون قوانینش معلومه). ولی عیبش اینه که تهیه اون قوانین خیلی سخته و زمانبره و سیستم در مواجهه با شرایط جدید که قانون براش نداره، عاجز میمونه.
امروزه با اومدن یادگیری ماشین، از سیستمهای خبره کلاسیک کمتر استفاده میشه، چون ML میتونه خودش از داده قانون رو کشف کنه. ولی هنوز هم هوش نمادین کاملاً کنار گذاشته نشده. ترکیب رویکردهای مبتنی بر دانش صریح با یادگیری ماشین خیلی مورد توجهه. حتی ChatGPT که یه مدل زبانیه، پشت صحنه یه دانشنامه بزرگ (ویکیپدیا و … که خونده) تو مغزش داره؛ ولی نمیتونه مثل سیستم خبره توضیح بده چرا جوابی رو داده، چون دانشش به صورت کد مشخص نیست. در کاربردهای حساس (مثل پزشکی یا حقوق)، بعضیها ترجیح میدن هنوز از سیستمهای خبره یا حداقل سیستمهای AI قابل توضیح (Explainable AI) استفاده کنن که بشه دلایل تصمیم رو ردیابی کرد.
سیستمهای توصیهگر – راهنمای انتخاب در زندگی دیجیتال
تقریباً همه ما هر روز با سیستمهای توصیهگر (Recommender Systems) سر و کار داریم، حتی اگه اسمشون به گوشمون نخورده باشه. وقتی توی فیلیمو یه سریال رو تموم میکنین و سیستم چند تا سریال دیگه رو پیشنهاد میده که شاید دوست داشته باشین – این کار یه الگوریتم توصیهگره. وقتی دیجیکالا زیر یک محصول میگه “خریداران این کالا، فلان کالا را هم خریدهاند”، باز هم یک سیستم توصیهگر داره پیشنهاد میده. حتی اینستاگرام که تصمیم میگیره چه پستهایی رو تو صفحه اکسپلور به شما نشون بده، یا یوتیوب که ویدیوهای بعدی رو ردیف میکنه، همه از همین تکنیکها استفاده میکنن.
سیستم توصیهگر معمولاً بر پایه یادگیری ماشین بنا شده اما به قدری مهمه که به عنوان یک شاخه خاص مورد توجه قرار گرفته. انواع روشهای توصیه وجود داره: بعضیها مبتنی بر تشابه محتوا هستن (مثلاً فیلمهای ژانر کمدی مشابه این فیلم)، بعضیها مبتنی بر تشابه کاربران (کسایی که سلیقهشون شبیه شما بوده این فیلم رو دوست داشتن). روش مدرن ترکیبی از هر دو و حتی استفاده از شبکههای عصبی عمیق برای درک بهتر علایق پنهان کاربره. برای مثال، نتفلیکس اعلام کرده الگوریتمش یک سیستم هیبرید (ترکیبی)ه که چندین مدل مختلف رو با هم ترکیب میکنه تا دقیقترین پیشنهاد رو بده.
تاریخچه جالبی هم داره: اوایل دهه ۲۰۰۰ آمازون از اولین پیشروان این حوزه بود و متوجه شد با پیشنهاد دادن اقلام مرتبط میتونه فروششو زیاد کنه. سال ۲۰۰۶ نتفلیکس یک چالش معروف برگزار کرد و جایزه بزرگ گذاشت برای تیمی که بتونه دقت توصیه فیلمهاشو حداقل ۱۰٪ بهبود بده. اون رقابت باعث پیشرفت زیادی در الگوریتمهای توصیهگر شد. حالا دیگه توصیهگرها انقدر قوی شدن که طبق آمارها ۸۰٪ از محتوایی که مردم در نتفلیکس تماشا میکنن بر اساس پیشنهاد سیستم بوده! این نشون میده الگوریتم چقدر خوب سلیقه شما رو میشناسه.
از اونجایی که امروزه با حجم عظیمی از انتخابها مواجهیم (صدها فیلم، هزاران آهنگ، میلیونها محصول)، سیستمهای توصیهگر یه جورایی قطبنمای ما در دنیای دیجیتال شدن. البته نگرانیهایی هم هست؛ مثلا اینکه این الگوریتمها حباب سلیقه ایجاد کنن (شما رو فقط در محدوده علاقهی قبلی خودتون نگه دارن و تنوع رو کم کنن) یا توصیههای جهتدار بدن. اما در کل، جزء جداییناپذیر تجربه آنلاین فعلیان و نمونهای عملی از هوش مصنوعی که خیلی بیسروصدا داره کار خودشو میکنه.
سایر رویکردهای هوش مصنوعی – از منطق فازی تا هوش ازدحامی
علاوه بر شاخههای مشهوری که گفتیم، هوش مصنوعی شامل یه سری تکنیکها و زیرشاخههای تخصصی دیگه هم هست که بد نیست با نامشون آشنا بشیم:
- منطق فازی (Fuzzy Logic): این رویکرد رو پروفسور لطفی زاده (دانشمند ایرانیتبار) تو دهه ۶۰ میلادی مطرح کرد. ایده اصلیش اینه که برخلاف منطق کلاسیک که همه چیز صفر یا یک، بله یا خیر هست، در منطق فازی درجاتی از درستی داریم (مثلا میتونیم بگیم امروز هوا “نسبتاً گرم” است). این منطق برای کامپیوترها مفیده تا با مفاهیم مبهم دنیای واقعی کنار بیان. ژاپنیها اولین کسایی بودن که به طور گسترده تو وسایل کاربردی ازش استفاده کردن. مثلا تهویه مطبوعهای هوشمند که اوایل دهه ۹۰ در ژاپن عرضه شدن با منطق فازی کار میکردن؛ اونها به جای اینکه کمپرسور رو یا کاملاً خاموش یا روشن کنن، کمکم دور موتور رو کم یا زیاد میکنن تا دما یکنواختتر کنترل بشه و مصرف برق کمتر شه. یا یک نمونه جالبتر: قطار زیرزمینی سندای در ژاپن اولین قطاری بود که با منطق فازی ترمزهاشو کنترل میکرد و گزارش شد حرکتش نرمتر شده و ۱۰٪ صرفهجویی انرژی داشته. منطق فازی حتی با سیستمهای خبره ترکیب شد و در صنایع (مثلاً کورههای سیمان) به کار رفت. امروزه اگرچه یادگیری ماشین غالب شده، اما منطق فازی هنوز در سیستمهای کنترل و بعضی محصولات الکترونیک کاربرد داره.
- الگوریتمهای تکاملی (Evolutionary Algorithms): اینها الهامگرفته از نظریه تکامل در زیستشناسی هستن. مثلا الگوریتم ژنتیکی رو در نظر بگیرین که مجموعهای از جوابهای ممکن برای یک مسئله رو مثل جمعیت موجودات در نظر میگیره و بعد تولیدمثل و جهش روی اونا انجام میده تا نسل به نسل جوابها بهتر شن! این روش برای حل مسائل بهینهسازی که راهحل دقیقشون سخت پیدا میشه خیلی به کار میاد. یک مثال معروف: ناسا در دهه ۹۰ با الگوریتم ژنتیکی طراحی آنتن فضاپیما رو بهینه کرد و به شکلهای عجیب اما کارایی رسید که با روش مهندسی معمولی بدست نمیاومد. الگوریتمهای تکاملی در صنعت برای طراحی قطعات، زمانبندی کارها یا حتی آموزش شبکههای عصبی هم استفاده شدن. مثلا گفته میشه شرکت دیپمایند (متعلق به گوگل) برای بهبود بعضی از مدلهای یادگیری عمیقش از جستجوی تکاملی استفاده کرده.
- هوش ازدحامی (Swarm Intelligence): در طبیعت دیدین مورچهها چطور با همکاری هم بهترین مسیر رو به غذا پیدا میکنن یا زنبورها چطور تصمیم میگیرن کندوی جدید کجا باشه؟ الگوریتمهایی مثل بهینهسازی مورچگان یا بهینهسازی ازدحام ذرات از همین رفتار جمعی الهام میگیرن. در بهینهسازی مورچگان (ACO)، یک سری مورچه مجازی مسیرهای مختلف حل یک مسئله (مثلا کوتاهترین مسیر تحویل کالا بین چند شهر) رو امتحان میکنن و فرایند تقویت و تبخیر فرومون رو شبیهسازی میکنن تا کمکم بهترین مسیر مشخص بشه. نتیجه اینه که میشه مسائل پیچیده مسیریابی یا زمانبندی رو با تقریب خوبی حل کرد. شرکتها برای بهینهسازی شبکه حمل و نقل، جریان ترافیک شهری یا حتی چینش ترانزیستورهای یک تراشه از این روشها بهره بردن. هوش ازدحامی یه نمونه جالب دیگهش دستهای از پهپادهاست که با الگوریتمی شبیه زنبورها بدون برخورد با هم پروازهای گروهی انجام میدن.
- محاسبات شناختی (Cognitive Computing): این اصطلاح رو بیشتر آیبیام با سیستم Watson سر زبونها انداخت. منظور سیستمهاییه که سعی میکنن شبیه فرآیندهای فکری انسان عمل کنن، مثلاً ترکیب تحلیل زبان، بینایی، دادههای زمینه و حتی حسهای دیگه برای درک متن_context و معنی. واتسون IBM تو سال ۲۰۱۱ تو مسابقه اطلاعات عمومی Jeopardy! قهرمانهای انسان رو شکست داد و نشون داد ترکیب شاخههای مختلف AI میتونه نتایج جالبی بده. امروز هم از مفهوم رایانش شناختی تو برنامههای مشاوره پزشکی استفاده میشه؛ یعنی سیستمهایی که مقالات پزشکی رو میخونن، سوابق بیمار رو درنظر میگیرن و به دکتر پیشنهاد درمان میدن. این شاخهایه که یه مقدار بینرشتهای محسوب میشه و شاید تعریف دقیقشم سخت باشه، اما کلیتش ترکیب چندین تکنیک AI برای رسیدن به تصمیمات شبیه انسانه.
موارد بالا تنها چند نمونه بود. شاخههای دیگه مثل تحلیل داده و دادهکاوی (که نزدیک به یادگیری ماشینه)، نمایش دانش و منطق (که به سیستمهای خبره مرتبطه) و حتی موضوعات فلسفیتر مثل هوش مصنوعی عمومی (AGI) هم وجود دارن که هر کدوم دنیای خودشونو دارن. اما فکر کنم برای یک دید کلی، همینهایی که گفتیم کفایت میکنه.
دنیایی گسترده فراتر از یک چتبات
همونطور که دیدیم، هوش مصنوعی یه دنیای پهناوره با تاریخچهای پر از فراز و نشیب. از سال ۱۹۵۶ که هوش مصنوعی به عنوان یک رشته علمی متولد شد تا امروز، چندین موج پیشرفت داشتیم؛ یه زمان سیستمهای خبره مد بودن، یه زمان شبکههای عصبی، حالا هم مدلهای زبانی بزرگ. هر کدوم از این موجها یه سری دستاورد به همراه آوردن. مثلاً سال ۱۹۹۷ برای همیشه تو خاطرهها موند چون کامپیوتر IBM دیپبلو تونست برای اولین بار قهرمان شطرنج جهان، گری کاسپاروف رو شکست بده – اتفاقی که نشون داد هوش مصنوعی میتونه در بازیای مثل شطرنج از انسان جلو بزنه. بعدش در سال ۲۰۱۶ هوش مصنوعی آلفاگو از شرکت دیپمایند تونست قهرمان بازی پیچیدهی گو یعنی لی سدول کرهای رو ۴-۱ شکست بده. اینا رو گفتم که تأکید کنم هوش مصنوعی فقط چتبات خوشصحبت نیست؛ تو مغز رباتها، تو دوربین ماشینها، تو موتور جستوجوها، همه جا هست.
برای یک علاقهمند غیرمتخصص، شاید همه این مباحث فنی به نظر بیان. ولی نکته دلگرمکننده اینه که لازم نیست ریاضیدان یا برنامهنویس باشیم تا قدر AI رو بدونیم. همین الانش هم AI داره زندگیمونو راحتتر میکنه: فیلم و آهنگ مطابق میلمون پیشنهاد میده، عکسهای گوشیمونو خودش دستهبندی میکنه، تایپ میکنیم غلطامونو میگیره، موقع رانندگی هشدار میده حواسمون نیست و دهها کمک ریز و درشت دیگه. پس دفعه بعد که کسی گفت “هوش مصنوعی مساوی فلان چتباته”، میتونیم با لبخند بگیم دنیای هوش مصنوعی خیلی بزرگتر و جالبتر از این حرفهاست!
در یک کلام، هوش مصنوعی یک ابزار همهکارهست؛ از گفتگو گرفته تا بینایی، از بازی شطرنج تا رانندگی، هرجا داده باشه و تصمیم، پای AI وسطه. ChatGPT و مدلهای زبانی بزرگ نشون دادن که چقدر این پیشرفتها میتونن جلوی چشم عموم هم بیان و همه رو شگفتزده کنن. اما همزمان، نباید تاریخچه و سایر شاخههای ریشهدار رو فراموش کنیم. این شاخهها مثل تکههای یه پازلان که کنار هم تصویر کاملی از مفهوم هوش مصنوعی رو میسازن. امیدوارم این مرور دوستانه بهتون کمک کرده باشه که تصویر بزرگتر AI رو ببینین و از گستردگیش لذت ببرین. آیندهای که در پیشه احتمالا ترکیبی از همه این تکنیکها رو به کار میگیره تا ماشینها رو باهوشتر و زندگی ما رو بهتر کنه. پس آشنایی با هر گوشه از این جنگل بزرگ هوش مصنوعی، خالی از لطف نیست!