java中this關(guān)鍵字 如何從一篇文章中提取出關(guān)鍵詞,有哪些經(jīng)驗(yàn)分享嗎?
如何從一篇文章中提取出關(guān)鍵詞,有哪些經(jīng)驗(yàn)分享嗎?提取關(guān)鍵詞主要是提取文章的主要內(nèi)容。主要取決于文章的類型。例如,敘事的主要關(guān)鍵詞是表達(dá)事件,基本上就是發(fā)生了什么,最顯著的特征是什么?關(guān)鍵詞是:when
如何從一篇文章中提取出關(guān)鍵詞,有哪些經(jīng)驗(yàn)分享嗎?
提取關(guān)鍵詞主要是提取文章的主要內(nèi)容。主要取決于文章的類型。
例如,敘事的主要關(guān)鍵詞是表達(dá)事件,基本上就是發(fā)生了什么,最顯著的特征是什么?關(guān)鍵詞是:when,where,what,how
解釋性文章,主要關(guān)鍵詞是解釋。除了說(shuō)明主要內(nèi)容外,還將描述數(shù)據(jù)對(duì)比什么。怎么做
議論文的主要關(guān)鍵詞是議論文的觀點(diǎn)。旁證后的主要觀點(diǎn)是什么,關(guān)鍵詞是什么。關(guān)鍵詞是:什么
還有一些綜合性的文章,一般要區(qū)分?jǐn)⑹鲂缘倪€是論證性的,解釋性的,還是綜合性的。除了提煉關(guān)鍵事件,他們還要提煉程度和觀點(diǎn)。
在信息爆炸的時(shí)代,不乏黨銜。關(guān)鍵詞往往不是標(biāo)題,需要讀者自己仔細(xì)辨認(rèn)。
搜索引擎能如此快速的在全網(wǎng)范圍內(nèi)檢索并抓取關(guān)鍵字,是怎么做到的?
要回答這個(gè)問(wèn)題,讓我們玩一個(gè)游戲。游戲規(guī)則如下:1。A提前在一張紙上寫一個(gè)小于1000的數(shù)字。B不知道。B會(huì)猜到的。
2. 每次B猜到一個(gè)數(shù)字,a需要告訴B它是否正確。如果不是,a需要告訴B他猜測(cè)的數(shù)字是大于還是小于紙上的數(shù)字。
3. 如果B猜不到12次,他就會(huì)贏。
你能在12次內(nèi)猜出1000以內(nèi)的數(shù)字嗎?如果你不懂?dāng)?shù)學(xué)原理,那就很難了。如果你知道“折衷方法”,那就很容易了。每次1000除以2,11乘以1。
假設(shè)紙上的數(shù)字是639。如果你從一個(gè)開(kāi)始,一次加一個(gè),你必須猜639次。如果從1000開(kāi)始,每次減去1,就需要300多次。B第一次猜500(1000的一半),a告訴他他更年輕。
B第二次猜到了750,但a說(shuō)它太大了。
B第三次猜到625,a說(shuō)太小了。
B第四次猜到687(625和750的中間值是四舍五入的),a說(shuō)它太大了。
第五次B猜656(625和687的中位數(shù)),a說(shuō)太大了。
B第六次猜到641(625和656的中位數(shù)),a說(shuō)它太大了。
B第七次猜到了633(625和641的中位數(shù)),a說(shuō)這個(gè)數(shù)字很小。
B第八次猜到了637,但a說(shuō)它太小了。
第九個(gè)猜測(cè)是639(637和641的中位數(shù)),a說(shuō)是正確的。
只花了九次就猜到了。
事實(shí)上,只要13次就可以猜出10000以內(nèi)的數(shù)字。如果數(shù)字小于10萬(wàn),最多可以猜17次。
搜索引擎索引原則與此類似,但不限于這些原則。例如,有二叉樹(shù)等等。
搜索系統(tǒng)將首先使用爬蟲(chóng)程序?qū)⒚總€(gè)網(wǎng)站的網(wǎng)頁(yè)信息爬網(wǎng)到自己的服務(wù)器上,以建立索引。建立索引的方法將使用與上述類似的數(shù)學(xué)原理。
有了索引,搜索速度更快。索引就像一本書的目錄,雖然書很厚,但是有目錄,你可以很快翻到你要找的章節(jié)。如果你沒(méi)有目錄,那么你翻閱你想去的章節(jié)會(huì)很慢。