سورنا هدایتی، تحلیلگر فنی سامانههای هوشمند
در فضای فناوری ایران تقریبا روزی نیست که خبرهای متعددی پیرامون ارائه «اولین بودن» یا «اختراع راهکارهای کاملاً نو» مطرح نشود. بسیاری از این موارد اما بدون بررسی دقیق از سوی کارشناسان و تحلیلگران صرفا به چشم تبلیغات شرکتها نگریسته میشوند و بعدها نیز خبری از عملیاتی شدن یا کارایی آنها به گوش نمیرسد.
از جمله حوزههایی که طی دو سال اخیر در آن بیش از سایر حوزهها شاهد چنین ادعاهایی بودهایم، حوزه هوش مصنوعی و ارائه محصولات بانکی بر پایه آن است بنابراین به نظر میرسد لازم باشد برای صحتسنجی این قبیل موارد، شاخصهایی که میتوان بر اساس آنها کارایی و نوآوری محصولات را سنجید، مرور کرد.
به عنوان مثال میتوان به برخی از این موارد در بانکهای مختلف و سایر نهادها اشاره کرد:
بانک ملی ایران:
بانک ملی چندین بار اعلام کرده است که در حال کار روی سیستمهای هوش مصنوعی برای مدیریت ریسک و اعتبارسنجی مشتریان است. همچنین از پروژههایی نظیر استفاده از چتباتها و تحلیل دادههای کلان (Big Data) برای بهینهسازی فرایندهای بانکی خبر داده است. با این حال، استفاده عملیاتی گسترده از این سیستمها هنوز گزارش نشده است.
بانک صادرات ایران:
این بانک در گذشته از برنامههایی برای توسعه سامانههای مبتنی بر هوش مصنوعی جهت شناسایی تقلب و مدیریت تراکنشهای مشکوک خبر داده است. بهرغم اعلامهای اولیه، جزئیات فنی یا نتایج عملیاتی آن به شکل رسمی منتشر نشده است.
بانک ملت:
بانک ملت در چندین کنفرانس فناوری اطلاعات و نوآوری، از پروژههایی مانند ایجاد شعب هوشمند خبر داده که با استفاده از هوش مصنوعی بتوانند خدمات بدون نیاز به کارمند ارائه دهند. این طرحها بیشتر در مرحله پایلوت یا تحقیقاتی باقی ماندهاند.
بانک مرکزی جمهوری اسلامی ایران (از طریق شاپرک):
شاپرک اعلام کرده که از فناوریهای پیشرفته تحلیل تراکنش برای تشخیص تخلفات در شبکه پرداخت استفاده میکند. اما گفته میشود که بسیاری از زیرساختهای مورد نیاز هوش مصنوعی در این پروژه هنوز به طور کامل بهینه نشدهاند و در مرحله آزمون و خطا قرار دارند.
بانک کشاورزی:
بانک کشاورزی از پروژهای با هدف اعتبارسنجی هوشمند مشتریان و تحلیل وضعیت کشاورزان بر اساس دادههای منطقهای خبر داده است. اما این سیستم هنوز به صورت گسترده در دسترس مشتریان یا شعب قرار نگرفته است.
در مورد این قبیل محصولات میتوان از دو منظر اصلی به موضوع نگاه کرد:
1. بخش LLM یا مدل زبانی اصلی
2. لایهٔ کاربردی و سرویسهای تخصصی روی آن
ابتدا ساختار کلی یک راهکار هوش مصنوعی بانکی مبتنی بر LLM را بررسی میکنیم و سپس نقدی بر ادعای برخی از این «اولین» بودنها و نیز پرسشهایی پیرامون صحت و عیار فنی چنین ادعاهایی ارائه شده است.
1) بررسی فنی بخش LLM
الف) مدل پایه یا پایه زبان (Base Language Model)
نوع مدل: آیا تیم مورد نظر از مدلهای خارج از ایران (نظیر GPT، Bloom، LLaMA و …) بهره گرفتهاند یا مدلی بومی را از ابتدا توسعه دادهاند؟
معمولاً آموزش مدلهای زبانی بزرگ (مثلاً در حد دهها میلیارد پارامتر) نیازمند زیرساخت محاسباتی و دیتاست بسیار وسیع است که در ایران، محدودیت منابع سختافزاری و دسترسی به دیتاستهای مناسب امری چالشبرانگیز است.
کیفیت دادههای آموزشی: اگر مدل کاملاً بومی باشد، دادههای زبانی فارسی و اسناد تخصصی بانکی ایرانی باید بهصورت پاکسازیشده و با حجمی کافی جمعآوری گردد. همچنین معیارهایی مانند تنوع و روزآمد بودن دادهها برای کاربرد بانکی اهمیت دارند.
همپوشانی زبانی: در ایران، بخش عمده اطلاعات بانکی، حقوقی و مقرراتی ممکن است به زبان فارسی باشد. در عین حال مستندات فنی یا تکنیکهای هوش مصنوعی و استانداردهای بینالمللی بانکداری (نظیر Basel، Swift، ISO20022 و …) غالباً به زبان انگلیسیاند. بنابراین کیفیت و چندزبانهبودن مدل میتواند عامل تعیینکنندهای در عملکرد نهایی باشد.
ب) چالشها و انتظارات
محرمانگی داده: مهمترین موضوع در حوزه بانکداری، حفظ امنیت و محرمانگی دادههاست. اگر قرار باشد مدل روی دادههای واقعی و حساس بانکی آموزش داده شود، تیم ادعاکننده باید توضیح دهد که چگونه استانداردها و الزامات امنیتی و محرمانگی را رعایت میکند.
توان پردازشی: آموزش مدلهای بزرگ نیازمند زیرساخت GPU/TPU قدرتمند است. در ایران معمولاً یا از دیتاسنترهای محدود داخلی استفاده میشود یا از سرویسهای ابری خارجی که با محدودیتهایی روبهرو هستند.
ارزیابی و اندازهگیری: اگر مدلی توسعه دادهاند، با چه متریکهایی (مانند Perplexity، BLEU، ROUGE یا تستهای تخصصی حوزه بانکی) آن را سنجیدهاند و آیا مستنداتی از نتایج ارزیابی کیفی و کمی ارائه دادهاند یا خیر؟
2) لایهٔ کاربردی روی LLM (تخصص بانکی)
الف) طراحی سرویسها و ابزارهای بانکی
پردازش متون حقوقی/بانکی: یکی از کاربردهای متداول، تبدیل و تحلیل قراردادهای بانکی، ضوابط و قوانین است. آیا این راهکار قادر است خدماتی نظیر خلاصهسازی قراردادها، تشخیص بندهای مهم، یا شناسایی موارد ریسک بدهد؟
پرسشوپاسخ تخصصی بانکی: سامانه باید بتواند پرسشهای رایج بانکی (مانند نرخ سود، شرایط تسهیلات، مقررات ضد پولشویی، شرایط اعتبارسنجی و…) را دقیق و معتبر پاسخ دهد. این نیازمند اتصال به پایگاه دانش بهروز (Knowledge Base) یا ایندکس اطلاعات مقرراتی و داخلی بانک است.
تشخیص تقلب (Fraud Detection): معمولاً برای کشف تقلب و تراکنشهای غیرعادی از مدلهای Machine Learning استفاده میشود. اگر این تیم مدعی است که از LLM برای این منظور بهره میبرد، باید مکانیسم پیادهسازی و دقت مدل در سناریوهای واقعی را تشریح کند.
یکپارچگی با سامانههای بانک: لایهٔ بالایی نیاز به یکپارچگی با Core Banking و سرویسهای درونی بانکها دارد. سؤال اینجاست که آیا واقعاً تستهای عملی در محیطهای بانکی انجام دادهاند یا صرفاً در حد یک نمونه آزمایشی (Proof of Concept) باقی مانده است؟
ب) مسائل فنی و مدیریتی
بهروزرسانی لحظهای: دادهها و نرخها در بانک دائماً تغییر میکنند (مثلاً نرخ سود تسهیلات، شرایط ضامن، قوانین جدید بانک مرکزی). یک سیستم واقعاً عملیاتی نیازمند مکانیزم بهروزرسانی دائمی این اطلاعات است.
اعتبار و ریسک پاسخها: یک مدل زبانی ممکن است پاسخهای اشتباه ولی با اعتمادبهنفس بالا ارائه دهد (پدیدهٔ Hallucination). در حوزه بانکی، اشتباهات میتوانند منجر به خسارات مالی یا مشکلات حقوقی شوند. بنابراین راهکاری که ارائه میشود باید روشهای اعتبارسنجی پاسخ و حدگذاری ریسک داشته باشد.
مقررات رگولاتوری: در ایران برای هر فعالیت بانکی باید مجوزها و تاییدیههایی از سمت نهادهای بالادستی نظیر بانک مرکزی اخذ شود. ادعای «راهاندازی هوش مصنوعی تخصصی بانکی» زمانی معتبر است که تطابق با دستورالعملهای بانک مرکزی و سایر نهادهای نظارتی فراهم شده باشد.
بررسی محصول «اولین هوش مصنوعی تخصصی بانکی در ایران»
1. کلیت ادعای «اولین»
در کشور ما بارها شنیده میشود که تیم یا شرکتی «اولین» یا «تنها» راهکار را ساخته است. در حوزه فینتک و AI نیز چنین اخباری زیاد مطرح میشود از جمله موردی که اخیرا تحت عنوان «هوش مصنوعی تخصصی بانکی» از سوی بانک ملت به عنوان یکی از بانکهای بزرگ کشور مطرح شده است. اما اگر به سابقه نگاه کنیم، برخی از بانکها و شرکتهای پرداخت (PSPها) سالهاست روی تحلیل رفتار مشتریان، سیستمهای پیشنهاددهی اعتباری یا مقابله با تقلب، راهکارهای مبتنی بر Chatbot و … کار میکنند. بنابراین صرف گفتن «اولین» چندان دقیق نیست و نیاز به ارائهٔ شواهد و مقایسه با نمونههای موجود دارد.
2. سطح بلوغ راهکار
ممکن است تیمی تنها یک نمونهی نمایشی (Demo) ساخته باشد چنانچه پیش ازاین نیز بانکهای دیگری چنین خبرهایی را منتشر کردهاند بنابراین لازم است تیمهای ارائه دهنده محصول به انتشار چند خبر و نمایش یک دموی جذاب، اکتفا نکنند چرا که منجر به برداشت «راهاندازی رسمی» میشود. اما فاصله میان PoC با محصول تجاری پایدار بسیار زیاد است. بنابراین باید دید آیا این راهکار در محیط واقعی بانکی با موفقیت کار میکند یا نه.
3. عدم شفافیت یا محدودیت دسترسی
اگر تیم مدعی دارای محدودیت در ارائه جزئیات است (به دلیل محرمانگی دادههای بانکی)، باید حداقل بتواند متریکها و ارزیابیهای فنی را بدون افشای دادههای حساس ارائه دهد تا صحت ادعایش مشخص شود.
همچنین لازم است پرسش شود آیا بانک یا موسسه مالی مشخصی این سامانه را بهکار گرفته و نام آن چیست؟ یا هنوز در مرحله مذاکرات است؟
4. امکان بهرهگیری از سرویسهای خارجی
برخی تیمها ممکن است صرفاً با «کاستومایز» کردن APIهای مدلهای خارجی مانند GPT یا Bard، یک Chatbot فارسی بسازند و مدعی بومیسازی شوند. البته این کار در نوع خود مفید است، اما نمیتوان به آن گفت «توسعهٔ اولین هوش مصنوعی تخصصی بانکی»؛ بلکه صرفاً یک لایه شخصیسازیشده روی یک موتور خارجی است.
نه خوشبینی مطلق، نه بدبینی مطلق
1. مدل استفادهشده: مشخص کنید آیا از پایه مدلهای خارجی و API استفاده میکنید یا مدل کاملاً بومی در داخل ایران توسعه داده شده است؟ حجم پارامترها و منابع محاسباتیتان چیست و چگونه تأمین میشود؟
2. تأمین و طبقهبندی دادهها: دیتاستهای بانکی از چه منابعی گردآوری شدهاند؟ حریم خصوصی دادههای مشتریان چگونه رعایت شده است؟ آیا از دادههای عمومی (نظیر مقررات بانک مرکزی) هم استفاده کردهاید؟
3. ارزیابی دقیق: چه شاخصهایی برای سنجش عملکرد سیستم استفاده میکنید و آیا نتایج تستها منتشر یا بهنوعی شفاف شده است؟ آیا بانک یا نهاد معتبری این نتایج را تأیید کرده است؟
4. یکپارچگی با سیستمهای بانکی: آیا پروژه صرفاً یک پلتفرم گفتگو (Chatbot) با پرسشهای از پیش تعیینشده است یا بهصورت عمیق با فرآیندهای بانکداری (مثل تسهیلات، احراز هویت مشتری، تحلیل گردش حساب) یکپارچه شده است؟
5. مقررات و امنیت: مجوزها یا تفاهمنامههای رسمی با بانک مرکزی یا بانکهای تجاری برای دسترسی به داده یا راهاندازی آزمایشی اخذ شده است؟ چه تدابیری برای امنیت سایبری (جلوگیری از نشت داده یا سوءاستفاده) اندیشیده شده است؟
6. مقیاسپذیری: اگر قرار است سامانه در مقیاس وسیع پاسخگوی هزاران کاربر بانکی بهصورت همزمان باشد، زیرساخت فنی چگونه مدیریت میشود؟ آیا تست استرس و پایداری انجام شده است؟
جمعبندی
اخبار حاوی «اولینها» در حوزهٔ فناوری بهخصوص هوش مصنوعی بانکی همواره از سوی کارشناسان با دقت مورد توجه قرار میگیرند و به همین خاطر هم لازم است شواهد قوی، نتایج ملموس و ارزیابیهای تاییدشده ارائه شوند. اگر تیم ارائه دهنده محصول مورد بررسی در این نوشته واقعاً زیرساخت یک LLM فارسی قوی و لایهٔ تخصصی بانکی را در ایران توسعه داده باشد، قطعاً نویددهنده پیشرفت بزرگی است. اما برای باورپذیری هر چه بیشتر نیازمند شفافیت در زمینهٔ فنی، مستندات ارزیابی و تاییدیههای رگولاتوری است. تا آن زمان، باید با دیدهٔ احتیاط و واقعبینی به این ادعا نگاه کرد و پرسشهای درستی را مطرح کرد تا مشخص شود چه مسیری طی شده و چه نتایجی بهدست آمده است.
نظر شما در مورد این مطلب چیه؟
ارسال دیدگاه