/ / बिगक्वायर के साथ लगभग स्ट्रिंग मिलान / फ़ज़ी स्ट्रिंग खोजना संभव है? - google-bigquery

BigQuery के साथ लगभग स्ट्रिंग मिलान / फ़ज़ी स्ट्रिंग खोज संभव है? - google-bigquery

BigQuery वितरित करने के लिए Google के लिए धन्यवाद, यह बहुत अच्छा है!
BigQuery के साथ लगभग स्ट्रिंग मिलान / फ़ज़ी स्ट्रिंग खोज संभव है?
क्या Google ने इस कार्यक्षमता को BigQuery में जोड़ने की योजना बनाई है?

निश्चित रूप से Google मालिकाना अनुमानित स्ट्रिंगGoogle बौद्धिक संपदा को बनाए रखने के दौरान मिलान करने वाले एल्गोरिदम का उपयोग BigQuery को इस क्षमता को वितरित करने के लिए किया जा सकता है। हमने सभी BigQuery दस्तावेज़ों और स्टैक ओवरफ़्लो प्रश्नों की खोज की है। बेशक ऐसा करने के लिए कई एल्गोरिदम हैं, हालांकि BigQuery के साथ एकीकृत कैसे करें?

हमारी जरूरत सरल है, दो तारों की तुलना करने के लिए जो अधिकतर समान होंगे हालांकि थोड़ा अलग हो सकता है। उदाहरण के लिए:

"Rhodes USA" vs. "Rhodes USA, LLC", vs. "Rhodes USA LLC".

हमारे BigQuery परीक्षणों से यह दो तार दिखाई देता हैBigQuery के लिए उनसे जुड़ने के लिए बिल्कुल मिलान करने की आवश्यकता है, यहां तक ​​कि प्रत्येक स्ट्रिंग में पिछली जगहों की संख्या तक भी। BigQuery के साथ एकीकरण के लिए इस कार्यक्षमता या मार्गदर्शन के अलावा बहुत सराहना की जाएगी। यह मिल्वौकी जेट्स, मिल्वौकी, डब्ल्यूआई में एक क्षेत्रीय, अभिनव, आंशिक जेट स्वामित्व वाली कंपनी के समर्थन में है। BigQuery वितरित करने के लिए Google फिर से धन्यवाद।

बहुत धन्यवाद और नमस्कार, एंड्रयू Paullin (414) 212-5372

उत्तर:

जवाब के लिए 5 № 1

दुर्भाग्यवश, अनुमानित स्ट्रिंग मिलान नहीं हैसमर्थित। आप नियमित रूप से अभिव्यक्तियों का उपयोग करके प्राप्त कर सकते हैं। बिगक्वायर से पहले डेटा को सामान्य करने के लिए आपकी सबसे अच्छी शर्त हो सकती है - यानी "रोड्स यूएसए" और "रोड्स, यूएसए" को उसी स्ट्रिंग में बदल दें। हालांकि, मैं इस समर्थन के लिए एक फीचर अनुरोध बग जोड़ूंगा।