به گزارش میمتالز، در قلب کورههای فولادسازی، جایی که دمای مذاب به بیش از ۱۶۰۰ درجه سانتیگراد میرسد و هر دقیقه تأخیر میتواند به افت کیفیت، افزایش مصرف انرژی و تحمیل هزینههای سنگین بینجامد، یک پرسش بنیادین سالهاست ذهن مهندسان و مدیران صنعتی را درگیر کرده است؛ چگونه میتوان فرآیند پیچیده فولادسازی و ریختهگری مداوم را به گونهای زمانبندی کرد که نه تنها تولید متوقف نشود، بلکه بهرهوری، کیفیت و صرفهجویی انرژی به طور همزمان به حداکثر برسد؟ این پرسش، صرفاً یک دغدغه عملیاتی در سطح کارخانه نیست؛ بلکه مسالهای راهبردی در مقیاس ملی است، به ویژه برای کشورهایی که صنعت فولاد سهمی قابلتوجه در تولید ناخالص داخلی، اشتغال صنعتی و درآمدهای صادراتی دارد.
برای درک اهمیت موضوع، باید جایگاه صنعت فولاد را در اقتصاد جهانی بازشناخت. طبق دادههای منتشرشده از سوی World Steel Association، تولید جهانی فولاد خام در سالهای اخیر از مرز ۱.۸ میلیارد تن در سال عبور کرده است. این حجم عظیم تولید، نه تنها شاخصی از ظرفیت صنعتی جهان است، بلکه نشاندهنده شدت مصرف انرژی در این بخش نیز هست. برآوردها نشان میدهد صنعت فولاد حدود ۷ تا ۸ درصد از کل انتشار دیاکسیدکربن صنعتی جهان را به خود اختصاص میدهد. در چنین مقیاسی، حتی یک درصد بهبود در بهرهوری انرژی یا کاهش توقفهای تولید، میتواند اثرات اقتصادی و زیستمحیطی قابلتوجهی در سطح ملی و جهانی ایجاد کند. از اینرو، مساله زمانبندی تولید در فولادسازی، مستقیماً با اهداف توسعه پایدار، رقابتپذیری صنعتی و امنیت انرژی گره خورده است، اما پیچیدگی این مساله دقیقاً از کجا ناشی میشود؟ فرآیند تولید فولاد، به ویژه در مرحله فولادسازی و ریختهگری مداوم، زنجیرهای از عملیات به هم پیوسته است که باید تقریباً بدون وقفه انجام شوند. هر «شارژ» مذاب پس از خروج از کوره قوس الکتریکی یا کنورتور، وارد مرحله پالایش ثانویه میشود و سپس باید در زمان مشخصی به ماشین ریختهگری مداوم منتقل شود. توقف بیش از حد میان این مراحل به معنای افت دما و نیاز به گرمسازی مجدد است؛ عملیاتی که هم انرژیبر است و هم میتواند ساختار متالورژیکی فولاد را تحت تأثیر قرار دهد. از سوی دیگر، محدودیتهای عملیاتی متعددی وجود دارد؛ چندین ماشین به صورت موازی کار میکنند، زمانهای حملونقل ثابت و غیرقابل چشمپوشیاند، ترتیب تولید برخی گریدهای فولادی باید رعایت شود و بسیاری از انتقالها مشمول قید «بدون انتظار» هستند.

از نگاه تئوریک، این مساله در رده مسائل «زمانبندی جریان ترکیبی بدون انتظار» قرار میگیرد که در ادبیات تحقیق در عملیات به عنوان مسالهای «NP-hard قوی» شناخته میشود. معنای عملی این اصطلاح آن است که با افزایش تعداد شارژها، تعداد حالتهای ممکن برای ترتیبدهی آنها به صورت فاکتوریلی رشد میکند. به عنوان نمونه، زمانبندی ۶۰ شارژ که در چند گروه ریخته دستهبندی شدهاند، فضایی از پاسخهای ممکن ایجاد میکند که از توان محاسباتی روشهای دقیق کلاسیک فراتر است، به بیان دیگر، حتی اگر از پیشرفتهترین مدلهای برنامهریزی عدد صحیح استفاده شود، در ابعاد صنعتی، یافتن جواب دقیق در زمان معقول تقریباً ناممکن خواهد بود.
در دهههای گذشته، پژوهشگران برای مواجهه با این چالش به الگوریتمهای فراابتکاری روی آوردهاند؛ روشهایی نظیر جستوجوی همسایگی متغیر (VNS)، جستوجوی تکرارشونده (ILS) و جستوجوی همسایگی بزرگ تطبیقی (ALNS)، این روشها به جای بررسی همه حالتها، با حرکتهای هدفمند در فضای جواب، تلاش میکنند به پاسخهای نزدیک به بهینه دست یابند، هر چند این رویکردها در بسیاری از کاربردها موفق بودهاند، اما یک ضعف ساختاری مشترک در بسیاری از آنها دیده میشود «نادیدهگرفتن «ساختار درونی» مساله» به بیان سادهتر، این الگوریتمها اغلب فضای جستوجو را تقریباً یکنواخت در نظر میگیرند، در حالی که همه بخشهای این فضا به یک اندازه ارزش اکتشاف ندارند.
نقطه عطف رویکرد جدید دقیقاً در همین بازاندیشی نهفته است. پرسش کلیدی این است «آیا میتوان با تحلیل ساختار مساله، نواحی امیدبخش فضای جستوجو را شناسایی و تمرکز الگوریتم را به آنها هدایت کرد؟» بررسیهای تجربی نشان دادهاند که برنامههای تولید باکیفیت، اغلب دارای نوعی «همراستایی» میان ترتیب شارژها و ترتیب ریختهها هستند. به عبارت دیگر، اگر توالی حرکت مذابها در مراحل اولیه با توالی تخصیص آنها به ماشینهای ریختهگری هماهنگ باشد، احتمال کاهش زمان انتظار و افت حرارتی افزایش مییابد.
برای کمیسازی این مشاهده، پژوهشگران شاخصی به نام «اندازه کوپلینگ» معرفی کردهاند؛ معیاری که میزان هماهنگی میان دو زیرمساله اصلی - توالی شارژها و توالی ریختهها - را اندازهگیری میکند. این معیار مبتنی بر یک ماتریس رابطه فازی و تابعی با توزیع نرم (نظیر تابع گاوسی) است که امکان سنجش تدریجی میزان انحراف از وضعیت مطلوب را فراهم میکند. اهمیت این طراحی در آن است که کوپلینگ به صورت صفر و یک تعریف نمیشود، بلکه طیفی پیوسته دارد. بنابراین، الگوریتم میتواند حتی بهبودهای کوچک در همراستایی را تشخیص داده و تقویت کند.
در این نقطه، مفهوم یادگیری تقویتی وارد صحنه میشود. بر خلاف الگوریتمهای کلاسیک که از توالیهای ثابت عملگرهای همسایگی استفاده میکنند، یادگیری تقویتی بر مبنای تعامل تدریجی با محیط عمل میکند. الگوریتم، هر بار که تغییری در برنامه ایجاد میکند، بازخوردی به صورت «پاداش» یا «جریمه» دریافت میکند و به مرور میآموزد در هر وضعیت کدام اقدام بیشترین بهبود مورد انتظار را دارد. استفاده از روشهایی مانند Q-learning در این چارچوب، به الگوریتم امکان میدهد میان بهرهبرداری از دانش موجود و اکتشاف گزینههای جدید تعادل برقرار کند.

اما نوآوری صرفاً در استفاده از یادگیری تقویتی خلاصه نمیشود؛ بلکه در نحوه ادغام آن با ساختار مساله نهفته است. معماری پیشنهادی به صورت سلسلهمراتبی طراحی شده است. در لایه نخست، سه چارچوب یادگیری به طور تعاونی عمل میکنند: یکی برای بهبود توالی شارژها، دیگری برای توالی ریختهها و سومی برای یادگیری همزمان هر دو. این طراحی بر این فرض استوار است که بهبود یک زیرمساله بدون توجه به دیگری میتواند به بنبست منجر شود. از این رو، یادگیری مشترک نقش حلقه اتصال را ایفا میکند و از واگرایی تصمیمها جلوگیری میکند.
با این حال، هر الگوریتم جستوجوی محلی (even هوشمندترین آنها) در معرض خطر گیر افتادن در بهینههای محلی است. برای مقابله با این مساله، لایه دوم معماری وارد عمل میشود؛ سازوکاری برای «نوسازی هدفمند». اگر طی تعداد مشخصی تکرار، بهبودی حاصل نشود، الگوریتم با اعمال تغییرات ساختاری معنادار، پاسخ را از وضعیت فعلی خارج میکند و سپس فرآیند یادگیری را ادامه میدهد. این رویکرد، تلفیقی از تنوعبخشی و حفظ دانش پیشین است؛ مفهومی که در الگوریتمهای تکاملی نیز مشاهده میشود.
نتایج تجربی حاصل از آزمون این چارچوب بر مجموعهای از مسائل با اندازههای مختلف نشان میدهد که عملکرد آن از بسیاری از الگوریتمهای پیشرفته پیشین بهتر است؛ نه تنها از نظر کیفیت جواب (مانند کاهش بیشینه زمان تکمیل یا میانگین زمان انتظار)، بلکه از نظر سرعت دستیابی به پاسخهای مناسب، این نکته در محیط صنعتی اهمیت دوچندان دارد، زیرا زمان محاسبه خود یک منبع محدود است و برنامه تولید باید در بازههای کوتاه به روزرسانی شود.
ترکیب یادگیری تطبیقی و تحلیل ساختاری، برنامهریزی فولادسازی را بهینه میکند، توقفها را حذف میکند و کارخانهها را به سمت تولید هوشمند، کمکربن و رقابتپذیر هدایت میکند.
تحلیل عمیقتر نشان میدهد که موفقیت این رویکرد ناشی از همافزایی سه مؤلفه کلیدی است؛ درک ساختاری مساله از طریق شاخص کوپلینگ، طراحی عملگرهای تخصصی متناسب با محدودیتهای واقعی کارخانه و استفاده از یادگیری تطبیقی برای انتخاب هوشمند این عملگرها. حذف هر یک از این اجزا، کارایی کلی سیستم را به طور محسوسی کاهش میدهد. به بیان دیگر، ارزش اصلی این پژوهش در «ترکیب» این عناصر است (نه در هر جزء به تنهایی).
در افق گستردهتر، این تحول را میتوان در چارچوب روند جهانی «دیجیتالسازی صنعت» و گذار به صنعت ۴.۰ تحلیل کرد. کارخانههای فولاد، که زمانی متکی به برنامهریزیهای نیمهدستی و تجربه عملیاتی بودند، اکنون به سمت استفاده از مدلهای پیشرفته دادهمحور و هوش مصنوعی حرکت میکنند. تجربه صنایع پیشرو در شرق آسیا و اروپا نشان داده است که سرمایهگذاری در بهینهسازی هوشمند میتواند بازدهی خطوط تولید را چندین درصد افزایش دهد - در صنعتی با حاشیه سود محدود، همین چند درصد میتواند تعیینکننده باشد، مساله زمانبندی در فولادسازی را نمیتوان صرفاً یک چالش فنی محدود به مهندسان برنامهریزی دانست. این مساله در نقطه تلاقی اقتصاد انرژی، رقابتپذیری صنعتی و نوآوری فناورانه قرار دارد. رویکردی که با فهم ساختار درونی مساله آغاز میشود و با یادگیری تطبیقی تکامل مییابد، نشان میدهد آینده بهینهسازی صنعتی در تلفیق دانش دامنهای با هوش مصنوعی نهفته است. برای دانشجویان و مدیران صنعتی، پیام روشن است: مزیت رقابتی آینده نه در افزایش صرف ظرفیت تولید، بلکه در هوشمندسازی تصمیمها شکل میگیرد.
چشمانداز پیش رو، اگرچه خالی از چالش نیست، اما واقعبینانه و امیدبخش است. زیرساختهای محاسباتی قدرتمندتر، دادههای عملیاتی دقیقتر و نیروی انسانی آموزشدیده، زمینهای فراهم کردهاند که چنین الگوریتمهایی از سطح پژوهش به بطن کارخانهها منتقل شوند. اگر این مسیر با سرمایهگذاری هدفمند و سیاستگذاری هوشمند همراه شود، میتوان انتظار داشت صنعت فولاد (به عنوان یکی از ستونهای اقتصاد صنعتی) به سمت تولیدی کارآمدتر، کمکربنتر و رقابتپذیرتر حرکت کند. در این صورت، پاسخ به پرسش آغازین دیگر صرفاً یک دستاورد دانشگاهی نخواهد بود، بلکه گامی عملی در جهت آیندهای پایدار و هوشمند برای صنعت خواهد بود.
منبع: ایراسین