मैं एक मॉडल का निर्माण कर रहा हूं जहां फर्मों को कीमतें तय करनी होंगी और उत्पादन निर्णय लेने होंगे। कीमतें निरंतर हैं और इसलिए निर्णय चर हैं। (सूची, अंतिम बिक्री, कीमतें ...)।
क्या सुदृढीकरण सीखने की विधि मैं उस नक्शे का उपयोग निरंतर से निरंतर कर सकता हूं? कौन से अजगर पैकेज हैं? अगर कोई अजगर पैकेज नहीं हैं, तो मैं एक आवरण लिख सकता हूं।
उत्तर:
उत्तर № 1 के लिए 1PyBrain मशीन लर्निंग की लाइब्रेरी है जिसे आप खोज रहे हैं। यह तंत्रिका नेटवर्क का काफी जटिल कार्यान्वयन है, लेकिन जब आप इसे समझते हैं तो आपको एक बहुत शक्तिशाली उपकरण मिलेगा
PyBrain तंत्रिका नेटवर्क मॉडलिंग के लिए एक अजगर पुस्तकालय है। PyBrain का अवलोकन आपको एक मूल विचार प्राप्त करना चाहिए: प्रत्येक टाइमस्टेप पर आप निरंतर मूल्यों के एक सेट के साथ तंत्रिका नेटवर्क प्रदान करते हैं और निरंतर मूल्यों का एक और सेट निकालते हैं। लेकिन अधिक महत्वपूर्ण यह है कि आप आउटपुट का मूल्यांकन कर सकते हैं और अपने तंत्रिका नेटवर्क को प्रशिक्षित कर सकते हैं।
ये सभी चरण - नेटवर्क प्रशिक्षण सहित - पहले से ही PyBrain में लागू हैं।