/ / Twitterはトレンドハッシュタグのつづりをどのように判断しますか? - Twitter、ハッシュタグ

Twitterはトレンドハッシュタグのスペルをどのように判断しますか? - twitter、ハッシュタグ

私はアプリのTwitterハッシュタグに似たハッシュタグシステムを構築しようとしています。ただし、異なるスペルをまとめてグループ化するときに、そのようなタグをスペルする方法を理解することはできません。

例として、Twitterで#abcを使用した場合#abc、#Abc、#abcなどの異なるスペルである可能性があります。 ハスタグがトレンドを出しているとき、それはトレンドリストの中にある綴りで表示されます。 #abCとすべての異なるバージョンをグループ化します。

どのようにして「正しい」つづりを決めるのですか?

回答:

回答№1は0

私はちょうど私のアプリケーションのためのハッシュタグシステムを構築しました、そして、私はそれで完全に終わっていません、しかし私の方法は#*のストリングを持っているどんなポストでも手に入れることでした。

GetHashes(t: string){
var hashed = t.match(/#w+/g);
if(hashed != null){
hashed.forEach(element => {
var unhashed = element.slice(0,0) + element.slice(1,element.length);
this.hashTags.push(unhashed);
});
}else{

}

}

その後、すべてのハッシュを取得したら、単純にすべてを小文字に変換します。それが私がデータベースに送るものです。私はFirebaseを使っているのでデータを非正規化して1トンに複製するので、投稿の内容全体をデータベースのタグの下に保存します。これは大量のデータストレージの無駄に思えるかもしれませんが、ストレージは安価です。それから私は高価な "ElasticSearch"や "Algolia"のような検索システムを実装する必要はありません(私はまだ全文検索のために必要ですが、私に多くのお金を節約するハッシュのために必要はありません)。

それから私がすべて#*を返したいときは、Firebaseデータベースでその参照を見つけるだけです。

私が理解できないのは、関数を動的に呼び出すハッシュタグリンクを作成する方法です。私はinnerHtmlを使ってきましたが、それはすべてを文字列にします。

これが少し助けてくれることを願います。