python生成器處理大數(shù)據(jù) python用法？

2023-06-05

2691

python用法？一.變量類型1.變量賦值Python中的變量賦值不需要類型聲明。每個(gè)變量在使用前都必須賦值，在賦值前不會(huì)被創(chuàng)建。使用等號(hào)給變量賦值。2.多個(gè)變量的賦值當(dāng)給多個(gè)變量賦值或在列表中交換數(shù)

python用法？

一.變量類型

1.變量賦值

Python中的變量賦值不需要類型聲明。每個(gè)變量在使用前都必須賦值，在賦值前不會(huì)被創(chuàng)建。使用等號(hào)給變量賦值。

2.多個(gè)變量的賦值

當(dāng)給多個(gè)變量賦值或在列表中交換數(shù)據(jù)時(shí)，可以使用這種賦值方法。

3.標(biāo)準(zhǔn)數(shù)據(jù)類型

內(nèi)存中存儲(chǔ)著多種類型的數(shù)據(jù)。Python定義了一些標(biāo)準(zhǔn)類型來存儲(chǔ)各種類型的數(shù)據(jù)。下面列出了幾種數(shù)據(jù)類型:

一，數(shù)字

數(shù)字?jǐn)?shù)據(jù)類型用于存儲(chǔ)數(shù)值，數(shù)字?jǐn)?shù)據(jù)類型是不可變的數(shù)據(jù)類型。Python支持三種不同的數(shù)字類型:

Int:通常稱為integer，沒有小數(shù)，正整數(shù)和負(fù)整數(shù)都可以。注意python3沒有python2 s長(zhǎng)型。

Float:浮點(diǎn)型由整數(shù)部分和小數(shù)部分組成，浮點(diǎn)型可以用科學(xué)的計(jì)數(shù)方法表示。

復(fù)數(shù):復(fù)數(shù)可以由實(shí)部和虛部組成。

b弦

String是python中最常用的數(shù)據(jù)類型，是一種不可變的數(shù)據(jù)類型，可以用單引號(hào)或雙引號(hào)表示。支持切片操作。

c，列表

List是python中的基本數(shù)據(jù)類型，是一種可變數(shù)據(jù)類型。這些元素用方括號(hào)括起來，并用逗號(hào)分隔。支持切片操作。

Python 列表生成是一個(gè)非常方便的用法。

d，元組

Python元組類似于列表，只是元組的元素不能修改。元組是不可變的數(shù)據(jù)類型。支持切片操作。

E.詞典

Dictionary是python中唯一的映射類型。它以鍵-值對(duì)的形式存儲(chǔ)數(shù)據(jù)，字典的鍵必須是不可變的數(shù)據(jù)類型。

總而言之:

不可變數(shù)據(jù)類型:當(dāng)該數(shù)據(jù)類型對(duì)應(yīng)變量的值發(fā)生變化時(shí)，其對(duì)應(yīng)的內(nèi)存地址也會(huì)發(fā)生變化。對(duì)于這種數(shù)據(jù)類型，稱為不可變數(shù)據(jù)類型。

變量數(shù)據(jù)類型:當(dāng)這個(gè)數(shù)據(jù)類型對(duì)應(yīng)的變量的值發(fā)生變化時(shí)，那么它對(duì)應(yīng)的內(nèi)存地址不變。對(duì)于這種數(shù)據(jù)類型，稱為可變數(shù)據(jù)類型。

第二，迭代器和生成器

一、迭代器

迭代器對(duì)象從集合的第一個(gè)元素開始訪問，直到所有元素都被訪問。

創(chuàng)建迭代器對(duì)象有兩種方法:1 .對(duì)于迭代器對(duì)象(列表、字符串、元組)，使用iter()方法創(chuàng)建一個(gè)迭代器數(shù)據(jù)類型的迭代器。2.使用 "元組生成和創(chuàng)建迭代對(duì)象。

有兩種方法返回迭代器中的元素:1。next()方法，每次調(diào)用都依次返回迭代器中的元素。如果迭代器中沒有元素，將會(huì)報(bào)告一個(gè)錯(cuò)誤。2.使用for循環(huán)取出元素。

B.發(fā)電機(jī)

在Python中，使用yield的函數(shù)稱為生成器。簡(jiǎn)單了解下一代迭代器就是迭代器。

在調(diào)用生成器運(yùn)行的過程中，函數(shù)每次遇到y(tǒng)ield都會(huì)暫停并保存當(dāng)前所有運(yùn)行信息，返回yield的值，下次執(zhí)行next()方法時(shí)從當(dāng)前位置繼續(xù)運(yùn)行。

類似地，也可以使用for循環(huán)調(diào)用生成器。

第三，條件語句

Python條件語句是由一個(gè)或多個(gè)語句的執(zhí)行結(jié)果(真或假)決定的代碼塊。

Python中用elif代替else if，所以if語句的關(guān)鍵詞是:if–elif–else。其中if和elif要跟條件，滿足條件就執(zhí)行代碼塊，執(zhí)行代碼；如果不滿足，則在else之后執(zhí)行代碼塊。

第四，循環(huán)語句

Python中的循環(huán)語句是for和while。

break語句可以跳出for和while的循環(huán)體。如果從for或while循環(huán)終止，則不會(huì)執(zhí)行任何相應(yīng)的循環(huán)else塊。

continue語句用于跳過當(dāng)前循環(huán)塊中剩余的語句，然后繼續(xù)下一個(gè)循環(huán)。

動(dòng)詞（verb的縮寫）功能

功能是一個(gè)有組織的、可重用的代碼段，用于實(shí)現(xiàn)單個(gè)或相關(guān)的功能。函數(shù)可以提高應(yīng)用程序的模塊化和代碼的重用率。

Python為列表、字典和字符串等數(shù)據(jù)類型提供了許多內(nèi)置函數(shù)。以下是這些常用函數(shù)的描述:

列表的功能:

字符串的功能:

字典的功能:

除了Python 的內(nèi)置函數(shù)，還可以設(shè)計(jì)自定義函數(shù)。

六、文件操作

Python open()方法用于打開文件并返回file對(duì)象。在處理文件的過程中需要這個(gè)功能。如果文件無法打開，將引發(fā)異常。

使用open()方法時(shí)，一定要關(guān)閉file對(duì)象，也就是調(diào)用close()方法。

open方法的兩個(gè)常用參數(shù)是file(文件路徑)和mode(讀寫文件的)。常用的模式方法有:

一般用With結(jié)構(gòu)。使用with structur

如何在Python中用scikit-learn生成測(cè)試數(shù)據(jù)集？

測(cè)試數(shù)據(jù)集是一個(gè)小型設(shè)計(jì)數(shù)據(jù)集，允許您測(cè)試機(jī)器學(xué)習(xí)算法或測(cè)試工具。

數(shù)據(jù)集中的數(shù)據(jù)有完整的定義(如線性或非線性)，以便您可以探索特定的算法行為。scikit-learn Python庫(kù)提供了一組函數(shù)，用于從可配置的測(cè)試問題中生成樣本以進(jìn)行回歸和分類。

在本教程中，您將學(xué)習(xí)測(cè)試問題以及如何使用scikit-learn在Python中進(jìn)行測(cè)試。

完成本教程后，您將了解:

如何生成多類分類預(yù)測(cè)試題

怎么生成二元分類預(yù)測(cè)測(cè)試問題

如何生成線性回歸預(yù)測(cè)測(cè)試題

讓讓我們開始吧。

教程概述

本教程分為三個(gè)部分，分別是:

1.測(cè)試數(shù)據(jù)集

2.分類試題

3.回歸測(cè)試問題

測(cè)試數(shù)據(jù)集

開發(fā)和實(shí)現(xiàn)機(jī)器學(xué)習(xí)算法的一個(gè)問題是如何知道你是否正確地實(shí)現(xiàn)了它們。出現(xiàn)錯(cuò)誤時(shí)，他們似乎還能工作。

測(cè)試數(shù)據(jù)集是一個(gè)小的設(shè)計(jì)問題，它允許你測(cè)試和調(diào)試算法和測(cè)試工具。它們也有助于更好地理解算法響應(yīng)參數(shù)變化的行為。

以下是測(cè)試數(shù)據(jù)集的一些理想特征:

它們可以快速而容易地生成。

它們包含 "已知 "or "理解 "與預(yù)測(cè)進(jìn)行比較的結(jié)果。

它們是隨機(jī)的，每次生成都允許在同一個(gè)問題上隨機(jī)變化。

它們很小，很容易在二維空間中可視化。

它們可以被放大。

我建議在開始新的機(jī)器學(xué)習(xí)算法或開發(fā)新的測(cè)試工具時(shí)使用測(cè)試數(shù)據(jù)集。

Scikit-learn是一個(gè)用于機(jī)器學(xué)習(xí)的Python庫(kù)，它提供了生成一組測(cè)試問題的函數(shù)。

在本教程中，我們將查看一些為分類和回歸算法生成測(cè)試問題的示例。

分類測(cè)試問題

分類是給數(shù)據(jù)分配標(biāo)簽的問題。

在這一節(jié)中，我們將研究三個(gè)分類問題:斑點(diǎn)、衛(wèi)星和圓圈。

斑點(diǎn)分類問題

make_blobs() (_)函數(shù)可用于生成高斯分布的blobs點(diǎn)。

您可以控制生成的斑點(diǎn)數(shù)量、生成的樣本數(shù)量以及一系列其他屬性。

考慮到斑點(diǎn)的線性可分性，這個(gè)問題也適用于線性分類。

以下示例是一個(gè)多類分類預(yù)測(cè)問題，它生成一個(gè)具有三個(gè)斑點(diǎn)的2D樣本數(shù)據(jù)集。

每個(gè)數(shù)據(jù)有兩個(gè)輸入和0、1或2類的值。

下面顯示了一個(gè)完整的示例。

從生成器導(dǎo)入make _ blobs

從matplotlib導(dǎo)入pyplot

從熊貓進(jìn)口數(shù)據(jù)框

#生成2d分類數(shù)據(jù)集

x，y生成斑點(diǎn)(n _樣本100，中心3，n _特征2)

#散點(diǎn)圖，按類值著色的點(diǎn)

df data frame(dict(xX[:，0]，yX[:，1]，labely))colors {0:r:blu:gr:的key，group

(axax，kindscatter，xx，yy，labelkey，colorcolors[key])

()

運(yùn)行這個(gè)示例將生成問題的輸入和輸出，然后創(chuàng)建一個(gè)方便的2D圖，用不同的顏色顯示不同種類的點(diǎn)。

請(qǐng)注意，考慮到問題生成器的隨機(jī)性，您的特定數(shù)據(jù)集和結(jié)果圖會(huì)有所不同。這是特色，不是錯(cuò)誤。

斑點(diǎn)測(cè)試分類問題的散點(diǎn)圖

在下面的例子中，我們將使用相同的樣本結(jié)構(gòu)。

月亮分類問題

Make_moons()函數(shù)(_)用于二進(jìn)制分類，將生成一個(gè)漩渦圖案，或兩個(gè)月亮。

您可以控制月亮形狀的噪波數(shù)量和要生成的樣本數(shù)量。

這個(gè)測(cè)試問題適用于可以學(xué)習(xí)非線性類邊界的算法。

以下示例生成一個(gè)中等噪點(diǎn)的月亮數(shù)據(jù)集。

#生成2d分類數(shù)據(jù)集

x，y make_moons(n_samples100，noise0.1)

下面顯示了一個(gè)完整的示例。

從進(jìn)口make_moons

從matplotlib導(dǎo)入pyplot

從熊貓進(jìn)口數(shù)據(jù)框

#生成2d分類數(shù)據(jù)集

x，y make_moons(n_samples100，noise0.1)

#散點(diǎn)圖，按類值著色的點(diǎn)

df data frame(dict(xX[:，0]，yX[:，1]，labely))

colors {0:r:blu:的key，group

(axax，kindscatter，xx，yy，labelkey，colorcolors[key])

()

運(yùn)行此示例將生成并繪制一個(gè)數(shù)據(jù)集以供參考，然后根據(jù)指定的類為樣本著色。

Monns測(cè)試分類問題的散點(diǎn)圖

圓分類問題

make_circles()函數(shù)(_)會(huì)生成數(shù)據(jù)集落入同心圓的二元分類問題。

同樣，和月亮測(cè)試問題一樣，你可以控制形狀中的噪波數(shù)量。

該試題適合學(xué)習(xí)復(fù)雜的非線性流行算法。

在下面的示例中，生成了帶有特定噪聲的圓形數(shù)據(jù)集。

#生成2d分類數(shù)據(jù)集

x，y make_circles(n_samples100，noise0.05)

下面顯示了一個(gè)完整的示例。

從導(dǎo)入make_circles

從matplotlib導(dǎo)入pyplot

從熊貓進(jìn)口數(shù)據(jù)框

#生成2d分類數(shù)據(jù)集

x，y make_circles(n_samples100，noise0.05)

#散點(diǎn)圖，按類值著色的點(diǎn)

df data frame(dict(xX[:，0]，yX[:，1]，labely))

colors {0:r:blu:的key，group

(axax，kindscatter，xx，yy，labelkey，colorcolors[key])

()

運(yùn)行示例并繪制一個(gè)數(shù)據(jù)集以供參考。

圓測(cè)試分類問題的散點(diǎn)圖

回歸測(cè)試問題

回歸是根據(jù)觀測(cè)數(shù)據(jù)預(yù)測(cè)數(shù)量的問題。

make_regression() (_)函數(shù)將創(chuàng)建一個(gè)輸入和輸出之間具有線性關(guān)系的數(shù)據(jù)集。

您可以配置樣本數(shù)量、輸入要素?cái)?shù)量、噪聲級(jí)別等。

這個(gè)數(shù)據(jù)集適合可以學(xué)習(xí)線性回歸函數(shù)的算法。

以下示例將生成100個(gè)中等噪聲的示例，所有示例都有一個(gè)輸入要素和一個(gè)輸出要素。

#生成回歸數(shù)據(jù)集

x，y mAK _ regression(n _ samples 100，n_features1，noise0.1)

下面顯示了一個(gè)完整的示例。

從導(dǎo)入make_regression

從matplotlib導(dǎo)入pyplot

#生成回歸數(shù)據(jù)集

x，y make_regression(n_samples100，n _ features1，noise0.1)

#繪制回歸數(shù)據(jù)集

(X，y)

()

運(yùn)行這個(gè)示例將生成數(shù)據(jù)并繪制x和y之間的關(guān)系，考慮到它是線性的，這很無聊。

回歸測(cè)試問題的散點(diǎn)圖

發(fā)展

這一部分列出了一些想法，您可能想探索這些想法來擴(kuò)展本課程。

比較算法。選擇一個(gè)測(cè)試問題，比較該問題的一系列算法并報(bào)告性能。

放大問題。選擇一個(gè)測(cè)試問題，并探索如何放大它。用漸進(jìn)的方法將結(jié)果可視化。你也可以探索一個(gè)特定的算法模型技巧和問題尺度。

其他問題。該庫(kù)提供了一套其他測(cè)試問題；為每個(gè)問題編寫了一個(gè)代碼示例來展示它們是如何工作的。

進(jìn)一步閱讀

如果您想更深入地了解，本節(jié)提供了關(guān)于這個(gè)主題的更多資源。

sci kit-學(xué)習(xí)用戶指南:數(shù)據(jù)集加載實(shí)用程序()

sci kit-了解API:數(shù)據(jù)集(#)

摘要

在本教程中，您了解了測(cè)試問題以及如何在Python中使用scikit-learn來使用它們。

具體來說，您學(xué)到了:

如何生成多類分類預(yù)測(cè)試題

如何生成二元分類預(yù)測(cè)測(cè)試題

如何生成線性回歸預(yù)測(cè)測(cè)試題

国产成人毛片视频|星空传媒久草视频|欧美激情草久视频|久久久久女女|久操超碰在线播放|亚洲强奸一区二区|五月天丁香社区在线|色婷婷成人丁香网|午夜欧美6666|纯肉无码91视频

python用法？

如何在Python中用scikit-learn生成測(cè)試數(shù)據(jù)集？

相關(guān)推薦

如何在Python中用scikit-learn生成測(cè)試數(shù)據(jù)集？