<nav id="y8awq"><sup id="y8awq"></sup></nav>
  • <optgroup id="y8awq"><sup id="y8awq"></sup></optgroup>
  • 歡迎訪問北大青鳥官方網站
    0535-2114665
    大數據工程師
    日期【2018-01-11 17:54:13】 共閱:【】次
    2.數據認識和清洗的總體要求
    理解問題 :我們將分析每一個變量,然后較全面地理解它的含義,以及對我們問題的重要性。
    單變量研究:我們將重點關注因變量(SalePrice),并且對這個變量做一些了解。
    多變量研究:我們嘗試理解因變量和自變量之間的關系。
    基礎清洗: 我們將清洗數據并且處理缺失值,離群點數據和分類型變量。
    測試驗證: 我們將通過多變量技術來檢測數據是否符合目標需求。
    3. 具體過程
    這里以kaggle的預測房價比賽為例: 
    相關鏈接:https://www.kaggle.com/c/house-prices-advanced-regression-techniques
     
    導入相應的python包
    #invite people for the Kaggle party
    import pandas as pd
    import matplotlib.pyplot as plt
    import seaborn as sns
    import numpy as np
    from scipy.stats import norm
    from sklearn.preprocessing import StandardScaler
    from scipy import stats
    import warnings
    warnings.filterwarnings('ignore')
    %matplotlib inline
    加載數據到內存
    df_train = pd.read_csv('./data/train.csv')
    df_test = pd.read_csv('./data/test.csv')
     

    上一篇:第一頁
    下一篇:最后一頁
    北青鳥課程
    學員風采
    聯系我們
    電話: 0535-2114665
    郵箱:bdqn@ytaccp.com
    網址:http://www.ytaccp.com/
    地址:煙臺市芝罘區南大街117號文化宮大廈2層
    0535-2114665
    手機站
    COPYRIHGT 2017 煙臺中北煙臺校區 版權所有 ALL RIGHTS RESERVED
    地址:煙臺市芝罘區南大街117號文化宮大廈2層 技術支持:煙臺北大青鳥
    亚洲2020久久久久久久,久久久久精品国产无码,在线播放国产精品三级网,亚洲日韩视频在看观看