黄视频网站在线免费观看-黄视频网站在线看-黄视频网站在线观看-黄视频网站免费看-黄视频网站免费观看-黄视频网站免费

千鋒教育-做有情懷、有良心、有品質(zhì)的職業(yè)教育機(jī)構(gòu)

手機(jī)站
千鋒教育

千鋒學(xué)習(xí)站 | 隨時(shí)隨地免費(fèi)學(xué)

千鋒教育

掃一掃進(jìn)入千鋒手機(jī)站

領(lǐng)取全套視頻
千鋒教育

關(guān)注千鋒學(xué)習(xí)站小程序
隨時(shí)隨地免費(fèi)學(xué)習(xí)課程

當(dāng)前位置:首頁(yè)  >  技術(shù)干貨  > 大數(shù)據(jù)學(xué)習(xí)教程:如何處理多類不平衡數(shù)據(jù)?

大數(shù)據(jù)學(xué)習(xí)教程:如何處理多類不平衡數(shù)據(jù)?

來(lái)源:千鋒教育
發(fā)布人:syq
時(shí)間: 2022-07-04 17:32:00 1656927120

  機(jī)器學(xué)習(xí)中的一個(gè)常見(jiàn)問(wèn)題是處理不平衡數(shù)據(jù),其中目標(biāo)類中比例嚴(yán)重失調(diào),存在高度不成比例的數(shù)據(jù)。如何處理多類不平衡數(shù)據(jù)呢?什么是多類不平衡數(shù)據(jù)?什么是SMOTE算法?為什么使用類別權(quán)重(Class weight)......下面將進(jìn)行詳細(xì)介紹。

如何處理多類不平衡數(shù)據(jù)

  什么是多類不平衡數(shù)據(jù)?

  當(dāng)分類問(wèn)題的目標(biāo)類(兩個(gè)或兩個(gè)以上)不均勻分布時(shí),稱為不平衡數(shù)據(jù)。如果不能處理好這個(gè)問(wèn)題,模型將會(huì)成為災(zāi)難,因?yàn)槭褂妙惒黄胶鈹?shù)據(jù)建模會(huì)偏向于大多數(shù)類。處理不平衡數(shù)據(jù)有不同的方法,最常見(jiàn)的是過(guò)采樣(Oversampling)和創(chuàng)建合成樣本。

  什么是SMOTE算法?

  SMOTE是一種從數(shù)據(jù)集生成合成算例的過(guò)采樣技術(shù),它提高了對(duì)少數(shù)類的預(yù)測(cè)能力。雖然沒(méi)有信息損失,但它有一些限制。

  合成樣本

  限制:

  · SMOTE不適用于高維數(shù)據(jù)。

  · 可能會(huì)發(fā)生類的重疊,并給數(shù)據(jù)帶來(lái)更多干擾。

  因此,為了跳過(guò)這個(gè)問(wèn)題,可以使用'class_weight '參數(shù)手動(dòng)為類分配權(quán)重。

  為什么使用類別權(quán)重(Class weight)?

  類別權(quán)重通過(guò)對(duì)具有不同權(quán)重的類進(jìn)行懲罰來(lái)直接修改損失函數(shù),有目的地增加少數(shù)階級(jí)的權(quán)力,減少多數(shù)階級(jí)的權(quán)力。因此,它比SMOTE效果更好。本文將介紹一些最受歡迎的獲得數(shù)據(jù)的權(quán)重的技術(shù),它們對(duì)不平衡學(xué)習(xí)問(wèn)題十分奏效。

  · Sklearn utils

  可以使用sklearn來(lái)獲得和計(jì)算類權(quán)重。在訓(xùn)練模型的同時(shí)將這些權(quán)重加入到少數(shù)類別中,可以提高類別的分類性能。

  from sklearn.utils import class_weightclass_weight =class_weight.compute_class_weight('balanced,np.unique(target_Y),target_Y)model = LogisticRegression(class_weight = class_weight)model.fit(X,target_Y)# ['balanced', 'calculated balanced', 'normalized'] arehyperpaameterswhic we can play with.

  對(duì)于幾乎所有的分類算法,從邏輯回歸到Catboost,都有一個(gè)class_weight參數(shù)。但是XGboost對(duì)二進(jìn)制分類使用scale_pos_weight,對(duì)二進(jìn)制和多類問(wèn)題使用樣本權(quán)重。

  · 數(shù)長(zhǎng)比

  非常簡(jiǎn)單明了,用行數(shù)除以每個(gè)類的計(jì)數(shù)數(shù),然后

  weights = df[target_Y].value_counts()/len(df)model = LGBMClassifier(class_weight = weights)model.fit(X,target_Y)

  · 平和權(quán)重技術(shù)(Smoothen Weights)

  這是選擇權(quán)重的最佳方法之一。labels_dict是包含每個(gè)類的計(jì)數(shù)的字典對(duì)象,對(duì)數(shù)函數(shù)對(duì)不平衡類的權(quán)重進(jìn)行平和處理。

  def class_weight(labels_dict,mu=0.15): total = np.sum(labels_dict.values()) keys = labels_dict.keys() weight = dict()for i in keys: score =np.log(mu*total/float(labels_dict[i])) weight[i] = score if score > 1else 1return weight# random labels_dictlabels_dict = df[target_Y].value_counts().to_dict()weights =class_weight(labels_dict)model = RandomForestClassifier(class_weight = weights)model.fit(X,target_Y)

  · 樣本權(quán)重策略

  下面的函數(shù)不同于用于為XGboost算法獲取樣本權(quán)重的class_weight參數(shù)。它為每個(gè)訓(xùn)練樣本返回不同的權(quán)重。樣本權(quán)重是一個(gè)與數(shù)據(jù)長(zhǎng)度相同的數(shù)組,包含應(yīng)用于每個(gè)樣本的模型損失的權(quán)重。

  def BalancedSampleWeights(y_train,class_weight_coef): classes = np.unique(y_train, axis =0)classes.sort()class_samples = np.bincount(y_train)total_samples = class_samples.sum()n_classes = len(class_samples) weights = total_samples / (n_classes* class_samples * 1.0)class_weight_dict = {key : value for (key, value) in zip(classes, weights)}class_weight_dict[classes[1]] = class_weight_dict[classes[1]] *class_weight_coefsample_weights = [class_weight_dict[i] for i in y_train] return sample_weights#Usageweight=BalancedSampleWeights(target_Y,class_weight_coef)model = XGBClassifier(sample_weight = weight)model.fit(X, target_Y)

  · 類權(quán)重與樣本權(quán)重:

  樣本權(quán)重用于為每個(gè)訓(xùn)練樣本提供權(quán)重,這意味著應(yīng)該傳遞一個(gè)一維數(shù)組,其元素?cái)?shù)量與訓(xùn)練樣本完全相同。類權(quán)重用于為每個(gè)目標(biāo)類提供權(quán)重,這意味著應(yīng)該為要分類的每個(gè)類傳遞一個(gè)權(quán)重。

  更多關(guān)于大數(shù)據(jù)培訓(xùn)的問(wèn)題,歡迎咨詢千鋒教育在線名師。千鋒教育擁有多年IT培訓(xùn)服務(wù)經(jīng)驗(yàn),采用全程面授高品質(zhì)、高體驗(yàn)培養(yǎng)模式,擁有國(guó)內(nèi)一體化教學(xué)管理及學(xué)員服務(wù),助力更多學(xué)員實(shí)現(xiàn)高薪夢(mèng)想。

tags:
聲明:本站稿件版權(quán)均屬千鋒教育所有,未經(jīng)許可不得擅自轉(zhuǎn)載。
10年以上業(yè)內(nèi)強(qiáng)師集結(jié),手把手帶你蛻變精英
請(qǐng)您保持通訊暢通,專屬學(xué)習(xí)老師24小時(shí)內(nèi)將與您1V1溝通
免費(fèi)領(lǐng)取
今日已有369人領(lǐng)取成功
劉同學(xué) 138****2860 剛剛成功領(lǐng)取
王同學(xué) 131****2015 剛剛成功領(lǐng)取
張同學(xué) 133****4652 剛剛成功領(lǐng)取
李同學(xué) 135****8607 剛剛成功領(lǐng)取
楊同學(xué) 132****5667 剛剛成功領(lǐng)取
岳同學(xué) 134****6652 剛剛成功領(lǐng)取
梁同學(xué) 157****2950 剛剛成功領(lǐng)取
劉同學(xué) 189****1015 剛剛成功領(lǐng)取
張同學(xué) 155****4678 剛剛成功領(lǐng)取
鄒同學(xué) 139****2907 剛剛成功領(lǐng)取
董同學(xué) 138****2867 剛剛成功領(lǐng)取
周同學(xué) 136****3602 剛剛成功領(lǐng)取
相關(guān)推薦HOT
什么是PlatformIo?

PlatformIO是什么PlatformIO是一個(gè)全面的物聯(lián)網(wǎng)開(kāi)發(fā)平臺(tái),它為眾多硬件平臺(tái)和開(kāi)發(fā)環(huán)境提供了統(tǒng)一的工作流程,有效簡(jiǎn)化了開(kāi)發(fā)過(guò)程,并能兼容各種...詳情>>

2023-10-14 12:55:06
云快照與自動(dòng)備份有什么區(qū)別?

1、定義和目標(biāo)不同云快照的主要目標(biāo)是提供一種快速恢復(fù)數(shù)據(jù)的方法,它只記錄在快照時(shí)間點(diǎn)后的數(shù)據(jù)變化,而不是所有的數(shù)據(jù)。自動(dòng)備份的主要目標(biāo)...詳情>>

2023-10-14 12:48:59
服務(wù)器為什么要用Linux?

服務(wù)器為什么要用Linux作為服務(wù)器操作系統(tǒng)的優(yōu)選,Linux在眾多選擇中脫穎而出。Linux作為服務(wù)器操作系統(tǒng)的優(yōu)選,有其獨(dú)特的優(yōu)勢(shì)和特點(diǎn)。包括其...詳情>>

2023-10-14 12:34:11
ORM解決的主要問(wèn)題是什么?

ORM(對(duì)象關(guān)系映射)解決的主要問(wèn)題是將關(guān)系數(shù)據(jù)庫(kù)與面向?qū)ο缶幊讨g的映射困境。在傳統(tǒng)的關(guān)系數(shù)據(jù)庫(kù)中,數(shù)據(jù)以表格的形式存儲(chǔ),而在面向?qū)ο?..詳情>>

2023-10-14 12:26:19
Go為什么不支持三元運(yùn)算符?

Go為什么不支持三元運(yùn)算符Go語(yǔ)言是一種以簡(jiǎn)潔和有效性為目標(biāo)的編程語(yǔ)言,因此在設(shè)計(jì)過(guò)程中,Go的設(shè)計(jì)者刻意排除了一些他們認(rèn)為可能導(dǎo)致復(fù)雜性或...詳情>>

2023-10-14 12:12:36
成人免费福利片在线观看| 高清一级做a爱过程不卡视频| 成人免费观看的视频黄页| 欧美a级v片不卡在线观看| 国产视频一区在线| 欧美夜夜骑 青草视频在线观看完整版 久久精品99无色码中文字幕 欧美日韩一区二区在线观看视频 欧美中文字幕在线视频 www.99精品 香蕉视频久久 | 久久国产影视免费精品| 国产福利免费观看| 国产一区精品| 一级片免费在线观看视频| 久久成人综合网| 欧美夜夜骑 青草视频在线观看完整版 久久精品99无色码中文字幕 欧美日韩一区二区在线观看视频 欧美中文字幕在线视频 www.99精品 香蕉视频久久 | 黄色免费三级| 麻豆系列 在线视频| 午夜精品国产自在现线拍| 欧美一级视频高清片| 日本伦理片网站| 欧美激情一区二区三区视频高清 | 成人免费网站视频ww| 天天做日日爱夜夜爽| 国产精品自拍一区| 久久精品大片| 一级女性全黄久久生活片| 麻豆污视频| 青青久久国产成人免费网站| 欧美日本免费| 韩国毛片基地| 国产成人精品综合| 成人a大片在线观看| 日韩男人天堂| 精品视频在线观看免费| 天天做日日爱| 国产原创视频在线| 国产麻豆精品高清在线播放| 日韩中文字幕一区| 欧美大片a一级毛片视频| 精品在线观看一区| 久久久久久久久综合影视网| 99久久精品费精品国产一区二区| 欧美国产日韩精品| 久久99中文字幕| 天天做日日爱| 你懂的国产精品| 日韩综合| 国产精品自拍一区| 日韩专区亚洲综合久久| 你懂的日韩| 你懂的日韩| 国产视频一区二区在线播放| 国产成人啪精品| 九九久久99| 精品国产香蕉伊思人在线又爽又黄| 国产成人啪精品视频免费软件| 麻豆网站在线看| 韩国毛片| 久久国产一区二区| 国产成人女人在线视频观看| 国产视频一区在线| 中文字幕一区二区三区 精品| 成人免费观看男女羞羞视频| 国产网站在线| 欧美电影免费看大全| 精品久久久久久影院免费| 精品国产亚洲人成在线| 99色视频在线观看| 久久精品免视看国产成人2021| 国产亚洲免费观看| 99热精品在线| 欧美另类videosbestsex久久 | 午夜激情视频在线播放| 国产成人精品综合在线| 成人免费网站视频ww| 欧美爱色| 国产视频在线免费观看| 一 级 黄 中国色 片| 亚洲不卡一区二区三区在线| 国产国语对白一级毛片| 久久国产精品只做精品| 成人在免费观看视频国产| 国产视频网站在线观看| 午夜欧美成人久久久久久| 日本免费乱理伦片在线观看2018| 91麻豆精品国产片在线观看| 久久精品道一区二区三区| 欧美激情影院| 天天做人人爱夜夜爽2020毛片| 精品国产一区二区三区精东影业| 日本久久久久久久 97久久精品一区二区三区 狠狠色噜噜狠狠狠狠97 日日干综合 五月天婷婷在线观看高清 九色福利视频 | 午夜久久网| 欧美1区2区3区| 日本伦理黄色大片在线观看网站| 国产一级强片在线观看| 沈樵在线观看福利| 免费国产在线观看| 成人免费福利片在线观看| 欧美a级大片| a级毛片免费观看网站| 亚洲第一页色| 深夜做爰性大片中文| 香蕉视频久久| 四虎久久精品国产| 日韩中文字幕一区| 一级毛片看真人在线视频| 国产成人女人在线视频观看| 日本久久久久久久 97久久精品一区二区三区 狠狠色噜噜狠狠狠狠97 日日干综合 五月天婷婷在线观看高清 九色福利视频 | 国产伦精品一区二区三区无广告| 国产成人精品一区二区视频| 欧美日本国产| 欧美另类videosbestsex视频| 久久99中文字幕久久| 可以在线看黄的网站| 国产精品自拍亚洲| 国产麻豆精品免费视频| 高清一级做a爱过程不卡视频| 国产视频一区在线| 99久久网站| 日韩专区亚洲综合久久| 精品毛片视频| 久久久成人网| 日韩一级黄色片| 精品久久久久久中文字幕2017| 久久国产精品只做精品| 中文字幕97| 欧美另类videosbestsex久久 | 色综合久久天天综合| 好男人天堂网 久久精品国产这里是免费 国产精品成人一区二区 男人天堂网2021 男人的天堂在线观看 丁香六月综合激情 | 久草免费在线观看| 色综合久久天天综线观看| 99久久精品费精品国产一区二区| 国产高清在线精品一区a| 一级女人毛片人一女人| 久久久成人影院| 二级片在线观看| 成人免费网站视频ww| 久久精品店| 精品久久久久久综合网| 精品视频在线观看免费| 国产原创视频在线| 999久久狠狠免费精品| 黄视频网站在线看| 精品国产一区二区三区免费 | 久久久成人网| 精品久久久久久中文字幕一区| 国产a毛片| 欧美激情在线精品video| 国产视频一区二区在线观看| 日韩免费在线视频| 一级女性全黄久久生活片| 精品国产亚一区二区三区| 亚欧视频在线| 精品视频免费在线| 九九久久99综合一区二区| 99久久视频| 久草免费在线观看| 九九久久99综合一区二区| 欧美a级v片不卡在线观看| 精品国产一区二区三区久久久蜜臀 | 日韩在线观看视频黄| 青草国产在线观看| 黄视频网站在线观看| 高清一级毛片一本到免费观看| 欧美激情一区二区三区视频| 高清一级片| 国产麻豆精品免费密入口| 国产成人精品综合| 美女被草网站| 99久久精品国产免费| 国产精品免费精品自在线观看| 久久精品免视看国产明星| 国产国语在线播放视频| 欧美激情一区二区三区视频高清 | 精品视频一区二区| 久久精品免视看国产成人2021| 国产国语对白一级毛片| 午夜在线观看视频免费 成人| 美女免费精品视频在线观看| 国产一区二区精品久久| 一级毛片视频播放| 黄视频网站在线看| 欧美大片a一级毛片视频| 精品国产一区二区三区久| 麻豆网站在线看| 日本久久久久久久 97久久精品一区二区三区 狠狠色噜噜狠狠狠狠97 日日干综合 五月天婷婷在线观看高清 九色福利视频 | 九九干| 国产麻豆精品免费视频| 色综合久久天天综合绕观看| 欧美另类videosbestsex视频| 毛片的网站| 亚洲不卡一区二区三区在线| 美女免费毛片| 欧美1区| 午夜激情视频在线观看| 久久国产影视免费精品| 国产亚洲免费观看| 久久精品店| 韩国三级香港三级日本三级la | 高清一级毛片一本到免费观看| 韩国三级一区| 欧美另类videosbestsex高清| 久久国产精品自由自在|