प्रोग्रामिंग, सवालों के जवाब में मदद करें / अजगर / सुदृढीकरण सीखने मेथोड्स जो निरंतर निरंतर मानचित्र बनाता है - अजगर, मशीन-शिक्षण, सुदृढीकरण-शिक्षण, अर्थशास्त्र

सुदृढ़ीकरण सीखने वाले मेथोड जो निरंतर निरंतर नक्शा रखते हैं - अजगर, मशीन-लर्निंग, सुदृढीकरण-सीखने, अर्थशास्त्र

मैं एक मॉडल का निर्माण कर रहा हूं जहां फर्मों को कीमतें तय करनी होंगी और उत्पादन निर्णय लेने होंगे। कीमतें निरंतर हैं और इसलिए निर्णय चर हैं। (सूची, अंतिम बिक्री, कीमतें ...)।

क्या सुदृढीकरण सीखने की विधि मैं उस नक्शे का उपयोग निरंतर से निरंतर कर सकता हूं? कौन से अजगर पैकेज हैं? अगर कोई अजगर पैकेज नहीं हैं, तो मैं एक आवरण लिख सकता हूं।

उत्तर:

उत्तर № 1 के लिए 1

PyBrain मशीन लर्निंग की लाइब्रेरी है जिसे आप खोज रहे हैं। यह तंत्रिका नेटवर्क का काफी जटिल कार्यान्वयन है, लेकिन जब आप इसे समझते हैं तो आपको एक बहुत शक्तिशाली उपकरण मिलेगा

PyBrain तंत्रिका नेटवर्क मॉडलिंग के लिए एक अजगर पुस्तकालय है। PyBrain का अवलोकन आपको एक मूल विचार प्राप्त करना चाहिए: प्रत्येक टाइमस्टेप पर आप निरंतर मूल्यों के एक सेट के साथ तंत्रिका नेटवर्क प्रदान करते हैं और निरंतर मूल्यों का एक और सेट निकालते हैं। लेकिन अधिक महत्वपूर्ण यह है कि आप आउटपुट का मूल्यांकन कर सकते हैं और अपने तंत्रिका नेटवर्क को प्रशिक्षित कर सकते हैं।

ये सभी चरण - नेटवर्क प्रशिक्षण सहित - पहले से ही PyBrain में लागू हैं।