पिछले कुछ महीनों में, मशीन लर्निंग फ़ाउंडेशन टीम माइक्रोसॉफ्ट रिसर्च ने “फी” नामक छोटे भाषा मॉडल (एसएलएम) का एक सूट जारी किया है जो विभिन्न बेंचमार्क पर उल्लेखनीय प्रदर्शन हासिल करता है।
उच्च-मूल्य वाले कौशल पाठ्यक्रमों के साथ अपने तकनीकी कौशल को बढ़ाएं
कॉलेज की पेशकश | अवधि | वेबसाइट |
---|---|---|
नॉर्थवेस्टर्न यूनिवर्सिटी | उत्पाद प्रबंधन में केलॉग स्नातक प्रमाणपत्र | मिलने जाना |
इंडियन स्कूल ऑफ बिजनेस | बीएसआई का डिजिटल परिवर्तन | मिलने जाना |
आईआईएम लखनऊ | फिनटेक, बैंकिंग और एप्लाइड जोखिम प्रबंधन में आईआईएमएल कार्यकारी कार्यक्रम | मिलने जाना |
पहले मॉडल, 1.3 बिलियन पैरामीटर Phi-1 ने चरम प्रदर्शन हासिल किया पायथन कोडिंग मौजूदा एसएलएम के बीच (विशेष रूप से ह्यूमनएवल और एमबीपीपी बेंचमार्क पर)।
“हम अब Phi-2 लॉन्च कर रहे हैं, एक 2.7 बिलियन पैरामीटर भाषा मॉडल जो असाधारण तर्क और भाषा समझ क्षमताओं को प्रदर्शित करता है, 13 बिलियन से कम पैरामीटर सेटिंग्स के साथ कोर भाषा मॉडल के बीच अत्याधुनिक प्रदर्शन प्रदर्शित करता है,” कंपनी ने कहा। एक अद्यतन में.
Phi-2 शोधकर्ताओं के लिए एक आदर्श खेल का मैदान है, विशेष रूप से यंत्रवत व्याख्या की खोज करने, सुरक्षा में सुधार करने या विभिन्न कार्यों पर प्रयोग विकसित करने के लिए।
“हमने Phi-2 उपलब्ध कराया है Azure AI स्टूडियो टेम्पलेट कैटलॉग भाषा मॉडल पर अनुसंधान और विकास को बढ़ावा देने के लिए, ”माइक्रोसॉफ्ट ने कहा।
उन कहानियों की खोज करें जिनमें आपकी रुचि है
भाषा मॉडल के आकार में सैकड़ों अरबों मापदंडों तक भारी वृद्धि ने कई उभरती क्षमताओं को उजागर किया है जिन्होंने प्राकृतिक भाषा प्रसंस्करण के परिदृश्य को फिर से परिभाषित किया है। हालाँकि, सवाल यह है कि क्या रणनीतिक रणनीतियों का उपयोग करके इन उभरती क्षमताओं को छोटे पैमाने पर हासिल किया जा सकता है। प्रशिक्षण के लिए विकल्प, जैसे, डेटा चयन।
माइक्रोसॉफ्ट ने कहा, “फी मॉडल के साथ हमारे काम का उद्देश्य एसएलएम को प्रशिक्षित करके इस प्रश्न का उत्तर देना है जो बहुत अधिक पैमाने पर मॉडल के बराबर प्रदर्शन हासिल करते हैं (लेकिन अभी भी सीमांत मॉडल से दूर हैं)।
कंपनी ने अनुसंधान समुदाय द्वारा आमतौर पर उपयोग किए जाने वाले संकेतों पर व्यापक परीक्षण भी किया।
टेक दिग्गज ने कहा, “हमने बेंचमार्क नतीजों से जो अपेक्षाएं की थीं, उनके अनुरूप व्यवहार देखा।”
