自然語言處理入門 為什么自然語言處理很難?
為什么自然語言處理很難?是很難,但是比自然語言處理的前二十年的進(jìn)步已經(jīng)好很多了,最近因?yàn)橐芯咳斯ぶ悄茏匀徽Z言處理方面的項(xiàng)目,所以一直在讀有關(guān)的書籍,從數(shù)學(xué)的奧妙,統(tǒng)計(jì)學(xué)的理論、概率論等等。讀了這么多
為什么自然語言處理很難?
是很難,但是比自然語言處理的前二十年的進(jìn)步已經(jīng)好很多了,最近因?yàn)橐芯咳斯ぶ悄茏匀徽Z言處理方面的項(xiàng)目,所以一直在讀有關(guān)的書籍,從數(shù)學(xué)的奧妙,統(tǒng)計(jì)學(xué)的理論、概率論等等。
讀了這么多的書,其實(shí)我發(fā)現(xiàn),很多東西靠的還是你對基礎(chǔ)的扎實(shí)程度。自然語言處理的前20年為什么會這么難,或者說毫無進(jìn)展,講的通俗一點(diǎn)就是人類的慣性思維決定了你的認(rèn)識事物的方法。
在前20年,科學(xué)家研究自然語言處理一直停留在或者說局限在人類學(xué)習(xí)語言的方式上,簡單來說,就是用電腦去模仿人腦,當(dāng)時大多數(shù)的科學(xué)家都認(rèn)為要讓機(jī)器去翻譯或者語音識別,就需要讓計(jì)算機(jī)去理解我們的語言,而要做到這一點(diǎn),就需要計(jì)算機(jī)具有像人類一樣的智慧,這就是人類認(rèn)識的普遍規(guī)律,我們也不要去笑話他們,因?yàn)槲ㄓ腥绱说脑囧e,才造就了今天的成就。
如今語音識別和翻譯已經(jīng)做得非常的好了,但是很多不在我們這種機(jī)器學(xué)習(xí)研究領(lǐng)域的人來說,還錯誤的認(rèn)為語音識別和翻譯是靠計(jì)算機(jī)理解了自然語言才實(shí)現(xiàn)的,其實(shí)際上是靠數(shù)學(xué)和統(tǒng)計(jì)學(xué)去實(shí)現(xiàn)的。
從規(guī)則到統(tǒng)計(jì)的進(jìn)步是人類認(rèn)識事物的一種突破,統(tǒng)計(jì)語言模型的建立,是當(dāng)今自然語言處理的基礎(chǔ)和關(guān)鍵,但是很多東西都會存在自己本身固有的缺陷,這是無法改變的。
語言模型中設(shè)計(jì)的數(shù)字關(guān)系、公式計(jì)算,N元模型的定位,為什么在馬爾科夫假設(shè)中N的值會這么小,里面涉及到的知識太多,在這里也無法一一回答給你。我只是想說,單純的自然語言處理已經(jīng)沒有像之前那么的毫無頭緒了,現(xiàn)在已經(jīng)比以前好的太多了。難,不是在于它的本身,而是在于它涉及的知識點(diǎn)實(shí)在太多。。。。
今年31歲,現(xiàn)在開始想自學(xué)Python語言,還來得及嗎?
這不是來不來得及,而是合不合適的問題
說實(shí)話,編程這項(xiàng)工作,入門門檻并不高,你會寫個if、else就差不多入門了。問題是它上限高啊,你想用編程找工作,不可能只用if、else吧?
迭代器、生成器、裝飾器等等,都要掌握。這條路其實(shí)并不好走,想要從入門到精通,快則半年,慢則。。。(跟你的認(rèn)真程度和天賦有關(guān)系)
如果剛接觸編程的話,按正常人的學(xué)習(xí)速度來算,精通python需要2年。到時候你可能已經(jīng)33歲了,然后找工作又會問你的學(xué)歷、項(xiàng)目開發(fā)經(jīng)驗(yàn)。
好,你又去在網(wǎng)上接一些外包項(xiàng)目做了一年,你34歲了。
假如最后你成功進(jìn)入了一項(xiàng)薪資各方面都還不錯的互聯(lián)網(wǎng)公司,你又能在里面工作幾年呢?眾所周知,互聯(lián)網(wǎng)公司的更新?lián)Q代很快,40歲就被辭退的不在少數(shù)。
再說說前面這3年里面,你總得帶娃、陪老婆吧、還要工作,這壓力得有多大呀
當(dāng)然了,如果你只是對python感興趣,也可以當(dāng)作業(yè)余興趣來學(xué)學(xué),畢竟終生學(xué)習(xí)很重要,如果是為了找工作而學(xué)python的話,我真心不建議
python代碼記不住可以找工作嗎?
Python以其上手快,成為很多人學(xué)習(xí)編程的入門首選,雖然他很火,但是大部分卻只應(yīng)用于科研領(lǐng)域,也就是做一些實(shí)驗(yàn)性的開發(fā),因?yàn)樗菀咨鲜?,有很多第三方庫,使用相?dāng)方便,但是完全用它開發(fā)的大型項(xiàng)目比起C/C ,Java等語言來說還是要少一些。
不知道樓主的情況如何,如果是想從事編程工作,寫代碼也和學(xué)習(xí)數(shù)理化一樣,不需要死記硬背,主要還是要看你的基本功力。
Python目前一個重要的應(yīng)用領(lǐng)域就是AI開發(fā),如果你想找這方面的工作,會Python會是一個很大的優(yōu)勢,然而即使你編程語言不行,如果數(shù)學(xué)功底好,也能彌補(bǔ)你的缺陷。
總體來說,代碼不必死記,但是你必須明白它的思想,這樣才能靈活運(yùn)用,也會很容易找到一份合適的工作。