布隆過濾器誤判怎么辦 面試遇難題,問:游戲中的敏感詞過濾是如何實現(xiàn)的,該怎么回答?
面試遇難題,問:游戲中的敏感詞過濾是如何實現(xiàn)的,該怎么回答?你好,你應該像我一樣是個程序員。涉及Java和web。有一個replace()方法,后跟兩個參數(shù),用于“set and replace”和用
面試遇難題,問:游戲中的敏感詞過濾是如何實現(xiàn)的,該怎么回答?
你好,你應該像我一樣是個程序員。涉及Java和web。有一個replace()方法,后跟兩個參數(shù),用于“set and replace”和用“*”替換一些“敏感詞”。具體技術(shù)可以關注我,我?guī)闳W技術(shù)!@很難找到新的高質(zhì)量數(shù)據(jù)。關注和重新分配它們是不好的
布魯姆過濾器是由布魯姆過濾器在1970年提出的。它實際上是一個很長的二進制向量和一系列隨機映射函數(shù)。Bloom過濾器可用于檢索元素是否在集合中。它的優(yōu)點是在空間效率和查詢時間上都比一般的算法好很多,缺點是有一定的錯誤識別率和刪除困難。
海量數(shù)據(jù)處理之什么是bloomfilter?
請記住,您可以制作一個程序,例如查找定點單詞。我只是不記得了。人們真的很蠢。
給你一個含有1億個QQ號碼的文件,如何快速的查找某個QQ號碼?
Bloom filter的特點是會有誤報,但不會有漏報。也就是說,對于Bloom filter驗證的數(shù)據(jù)文件,它可能不包含您要查找的數(shù)據(jù)項,但是包含您要查找的數(shù)據(jù)項的數(shù)據(jù)文件將被返回。在key-value系統(tǒng)中,bloom會返回數(shù)據(jù)文件,過濾器返回的數(shù)據(jù)文件還需要檢查內(nèi)容,以知道是否有所需的數(shù)據(jù),從而保證執(zhí)行結(jié)果的正確性和完整性。
因此,鍵值系統(tǒng)不會因此出錯,只需訪問更多的數(shù)據(jù)文件即可。
在數(shù)據(jù)量大的鍵值系統(tǒng)中,建立統(tǒng)一的b樹索引的成本很高,維護成本也很高,所以Bloom filter的性能最好。
布隆過濾器既然有錯誤率,為什么還能應用在key-value系統(tǒng)中?
redis bloom filter的功率為1000,bitmap的功率為1100。不同的是力量不同