एआई वास्तविक लोगों की नकल करके वेबसाइटों का मूल्यांकन करता है और यहां तक ​​कि उन्हें आउटमैच भी करता है। यह कैसे किया जाता है?

आज, एक बुद्धिमान वेबसाइट रिडिजाइन सिस्टम uKit AI के घटकों में से एक, सार्वजनिक हो रहा है। यह वेब पृष्ठों की सुंदरता के मूल्यांकन के लिए एक प्रोटोटाइप मॉड्यूल है। यह एक तंत्रिका नेटवर्क को जोड़ती है और वेबसाइट के डिजाइन के लिए एक सामान्य आगंतुक की प्रतिक्रिया की नकल करने के लिए पेड़ों का निर्णय करती है।

भविष्य में, ऐसा मॉड्यूल जनरेटिव डिज़ाइन अल्गोरिथम, uKit AI के प्रमुख तत्व के काम का मूल्यांकन करेगा, जो उपलब्ध सामग्री पर निर्भर मानव भागीदारी के बिना पृष्ठों को डिज़ाइन करेगा और एक गैर-प्रभावी वेबसाइट के बीच अंतर का "ज्ञान" होगा। एक रूपांतरण दर बढ़ाने के उद्देश्य से।

वर्तमान WebScore AI संस्करण वेबसाइट उपस्थिति के बारे में एक औसत इंटरनेट उपयोगकर्ता के दृष्टिकोण को दर्शाता है। हालांकि, हम अन्य विकल्प बना सकते हैं, उदाहरण के लिए, वेबसाइट की उपयोगिता को रेट करना संभव है।

सिस्टम को प्रशिक्षित करने के लिए इस्तेमाल की जाने वाली वेबसाइटें। सबसे पहले, हमने विभिन्न प्लेटफार्मों पर और विभिन्न भाषाओं में विभिन्न वर्षों में बनाए गए 12,000 साइट और ऑनलाइन स्टोर एकत्र किए हैं। मुख्य कार्य काफी खराब वेबसाइटों से बहुत अच्छे लोगों के लिए पर्याप्त दृश्य उन्नयन उदाहरण प्राप्त करना था। इस तरह, हमने सिस्टम को दिखाया कि वह आधुनिक वेब में क्या आ सकता है।

प्रशिक्षण नमूने से वेबसाइटों के एक जोड़े।

प्रत्येक श्रेणी को एक पैमाने के साथ मापा जाता है, और इस पैमाने को एक सामान्य व्यक्ति द्वारा समझा जाना चाहिए, जिसकी राय हम मॉडल करने की कोशिश करते हैं। इसलिए, हम the 1 से 10 'पैमाने के विचार के साथ आए, जिसका उपयोग हमारी सेवा में किया जाता है।

जो लोग WebScore AI द्वारा नकल कर रहे हैं। विभिन्न प्रकार की वेबसाइटों से डेटासेट (प्रशिक्षण मॉडल के लिए डेटा का एक सेट) बनाने के लिए हमें दो चीजों की आवश्यकता थी:

  • वे संकेत जिनके द्वारा सिस्टम यह निर्धारित करेगा कि वेबसाइट आकर्षक है;
  • वेबसाइटों की एक निश्चित राशि के लिए हमारे पैमाने की मदद से किए गए मूल्यांकन (निशान)। वे सिस्टम के लिए एक मॉडल बन जाएंगे।

किसी को ये प्रारंभिक मूल्यांकन करना चाहिए। इस तरह के एक "शिक्षक", या "शिक्षकों" का एक समूह, और अधिक विशिष्ट होने के लिए, यह बहुत प्रभावित करेगा कि मॉडल कैसे काम करेगा।

वेबसाइट मूल्यांकन इंटरफ़ेस: जल्द ही हमारे GitHub से ले और उपयोग करें।

फोकस समूह को इकट्ठा करने के लिए, हमने 1500 वेबसाइट उदाहरणों पर उम्मीदवारों का प्रारंभिक चयन किया। एक नियमित काम, लेकिन एक जिम्मेदार और महान ध्यान केंद्रित करना। प्रारंभिक चयन ने हमें अनुपयोगी उम्मीदवारों को खत्म करने और "विवादास्पद" (जब कोई इसे 1 और दूसरे को 10 के रूप में रेट करता है) वेबसाइटों को नमूने से बाहर करने में मदद की।

सबसे पहले, हमने मूल्यांकन विधियों के साथ प्रयोग किया।

उदाहरण के लिए, हमने एक समय में एक वेबसाइट का मूल्यांकन करने की पेशकश की, फिर एक ही समय में दो वेबसाइट, या दो में से एक को चुनने के लिए, सबसे आकर्षक एक। दृष्टिकोण जहां प्रतिवादी ने एक एकल वेबसाइट देखी और मूल्यांकन किया उसने सबसे अच्छा काम किया। हमने शेष वेबसाइटों के 10.000 का मूल्यांकन करने के लिए इसका उपयोग किया।

एक व्यक्ति ने मूल्यांकन किया कि कोई वेबसाइट सुंदर है या नहीं। मशीन ऐसा कैसे करेगी? आपको और मुझे किसी चीज़ के समग्र सौंदर्य पर एक राय बनाने के लिए केवल एक नज़र की आवश्यकता है। लेकिन हम जानते हैं कि शैतान विवरण में है।

वेबसाइट विज़ुअल आकर्षण के संकेत जो मॉडल का मार्गदर्शन करेगा, पूरे प्रोजेक्ट के लिए एक महत्वपूर्ण क्षण है। हमने यूकेइट वेबसाइट बिल्डर डिजाइन टीम से एक हाथ के लिए कहा, उनके काम को सैकड़ों हजारों वेबसाइटों के लिए एक आधार के रूप में उपयोग किया जाता है, और लाखों लोग इसे पसंद करते हैं। साथ में हमने उन विशेषताओं की एक विस्तारित सूची संकलित की है जो वेबसाइट डिज़ाइन को विकसित करते समय पेशेवर ध्यान देते हैं। और फिर इसे काटने की कोशिश की, केवल सबसे महत्वपूर्ण लोगों को छोड़कर।

uKit.com डिजाइन टीम।

परिणामस्वरूप, हमें पंद्रह श्रेणियों में समूहीकृत 125 काफी अलग-अलग महत्वपूर्ण मानदंडों का एक चेकलिस्ट मिला। उदाहरण के लिए, सूची में है: लोकप्रिय स्क्रीन के लिए अनुकूलन, विभिन्न प्रकार के फ़ॉन्ट आकार, रंगों की शुद्धता, शीर्षकों की लंबाई, पूरे पृष्ठ पर छवियों का अनुपात और इसी तरह। इन नियमों का उपयोग करके मॉडल को प्रशिक्षित करने के लिए क्या करना बाकी है

एक एल्गोरिथ्म बनाएँ। 'टीचिंग मॉडल' वास्तव में क्या है? यह एक एल्गोरिथ्म का निर्माण है जो विशेषताओं के एक सेट पर आधारित है और चयनित वेबसाइट का मूल्यांकन कर सकता है। यह वांछनीय है कि सिस्टम का मूल्यांकन और औसत शिक्षक का मूल्यांकन उनके अंतिम मूल्यांकन में न्यूनतम अंतर को साझा करता है।

हमने निर्णय पेड़ों पर ढाल बढ़ाने की विधि का उपयोग करने का निर्णय लिया है, क्योंकि यह सबसे लोकप्रिय और प्रभावी दृष्टिकोणों में से एक है। बुनियादी एल्गोरिदम का उपयोग करते हुए, यह एक सेट का निर्माण करता है, जिसका समग्र परिणाम किसी भी अलग एल्गोरिथ्म के परिणामों से अधिक होता है।

इसके अलावा, प्रत्येक बाद के बुनियादी एल्गोरिथ्म को जोड़ने पर, यह पूरे सेट के उत्तरों की गुणवत्ता में सुधार करने की कोशिश करता है।

इस प्रक्रिया में तेजी लाने और इसे आसान बनाने के लिए, हमने यैंडेक्स से कैटबॉस्ट लाइब्रेरी का उपयोग किया, जो तथाकथित "गुमनामी के पेड़ों" में एक ढाल-आधारित बूस्टर का निर्माण करने की अनुमति देता है जो शुरू से एक मॉडल की अच्छी प्रशिक्षण क्षमताओं को सुनिश्चित करता है और प्रदान करने के लिए एक त्वरित संक्रमण (अनुमान) ) नई वस्तुओं के लिए।

एक तंत्रिका नेटवर्क जोड़ना। जब बुनियादी एल्गोरिथ्म तैयार हो गया था, तो हमने एक प्रयोग करने का फैसला किया: यदि हम एक तंत्रिका नेटवर्क जोड़ते हैं तो परिणाम बेहतर होंगे? असल में, हम पहले से ही जानते थे कि at एक वेबसाइट और उसके डिज़ाइन को कैसे देखें ’, और अब हमने सिस्टम को किसी तरह का of आवर्धक ग्लास’ देने का फैसला किया है जिसका उपयोग वह और भी अधिक विवरण प्रकट करने के लिए कर सकता है।

हमने सबसे लोकप्रिय नेटवर्क में से एक, रेसनेट 50 को चुना, इसे उच्च-स्तरीय विशेषताओं को निकालने के लिए एक अच्छे एल्गोरिदम के रूप में जाना जाता है। और हमने सीखा है कि वेबसाइट मूल्यांकन के लिए 1000 अतिरिक्त विशेषताएँ कैसे प्राप्त करें। नतीजतन, सिस्टम अब कुल 1125 सुविधाओं के आधार पर एक URL की विशेषता रखता है और 10-बिंदु पैमाने पर वेबसाइट की 'जगह' पाता है। इस प्रक्रिया में कई दर्जन सेकंड तक का समय लगता है, इसलिए हम उसी स्तर पर मूल्यांकन की गुणवत्ता को बनाए रखते हुए संकेतों की संख्या को कम करके मॉडल को गति देने पर विचार करते हैं।

पहला परिणाम। इस तरह से प्रशिक्षित मॉडल व्यक्तिगत। शिक्षकों की तुलना में 3 गुना अधिक सटीक अनुमान लगा सकता है।

हम कह सकते हैं कि मॉडल ने अपने पहले शिक्षकों को पीछे छोड़ दिया क्योंकि फ़ोकस समूह का अनुमान तंत्रिका नेटवर्क के अनुमान से बहुत अधिक औसत से भिन्न है। अब हम एल्गोरिदम को आगे के प्रशिक्षण के लिए नेटवर्क में डालते हैं। और आप इसके शिक्षक भी बन सकते हैं।