• <track id="0aiby"><code id="0aiby"><dd id="0aiby"></dd></code></track>

    <ins id="0aiby"></ins>

    當前位置: 主頁 > 國內 >

    聯想大數據團隊取得Kaggle頂尖數據科學競賽優異成績

    時間:2018-01-19來源:互聯網 作者:編輯 點擊:
    近日,聯想大數據團隊在全球知名的Kaggle數據科學競賽中,以優異的表現在“網站流量預測”(Web Traffic Time Series Forecasting)競賽項目躋身前15名。該競賽云集了全球數據科學領域的眾多高

      近日,聯想大數據團隊在全球知名的Kaggle數據科學競賽中,以優異的表現在“網站流量預測”(Web Traffic Time Series Forecasting)競賽項目躋身前15名。該競賽云集了全球數據科學領域的眾多高手,獲得這一突破性的成績是對聯想大數據技團隊技術與實踐能力的有力證明。

      由Google贊助的Kaggle競賽致力于推動數據科學與機器學習的前沿發展,是該領域所有專業人士的試煉廠,考驗數據相關理論知識在實踐中所需的各項能力。

      此次聯想大數據團隊參與的“網站流量預測”競賽項目重點,是預測多個時間序列未來價值的問題,這一直是該領域最具挑戰性的問題之一。更具體地說,這個競賽項目的目標是測試參與者所設計的最先進的方法,預測約145000維基百科文章的未來網絡流量問題。

      因此,聯想大數據團隊面對的最大挑戰就是,網站數量和流量龐大,并且是關于不同主題、使用不同語言(中文、英文、德語、西班牙語、日語、法語)、又分為不同的瀏覽媒介(PC、手機等)和不同的瀏覽對象(人類、爬蟲)。這些復雜的組合使得這些網站的瀏覽量有著非常不同的表現,極難通過單一的模型來刻畫,而由于數量過多,分別建模又不可行;不僅如此,需要預測未來60天每天的流覽量,時間距離遠且單位小。

      針對這一挑戰,聯想大數據團隊積極備戰近兩個月時間,最終拿出的方案是準備多個不同的模型,在模型選取過程中加入一些自適應性,即根據不同模型在歷史數據上的表現、數據的分布特征,時間距離讓算法自行選擇最優模型,并且這些模型有著不同的側重點,比如有的更注意周期性,有的更注意近期的局部表現,將這些模型進行集成。

      最終,這一思路和方案得到了認可,在該競賽項目中獲得第12名的好成績,取得歷史性突破。展望未來,這一技術突破有望運用于供應鏈管理(如產品銷量預測等),或者其他的時間序列預測類場景,能夠發揮重要的業務價值。

      聯想大數據獲獎團隊成員表示:“很高興能夠在這一國際數據賽事中取得好成績,并得到業界的認可。大家以絕不服輸的精神,把專注、嚴謹和精湛的專業素質在比賽過程中發揮出來。這次給我們的最大啟發,就是更多地走到實踐中,積累豐富的知識,靈活地運用到各種場景中,發揮真正的價值?!?/P>

    頂一下
    (0)
    0%
    踩一下
    (0)
    0%
    ------分隔線----------------------------
    發表評論
    請自覺遵守互聯網相關的政策法規,嚴禁發布色情、暴力、反動的言論。
    評價:
    文章導航
    推薦內容
    丁香婷婷激情综合俺也去_国产精品国色综合久久蜜桃_欧美在线播放一区三区不卡_九九久久国产精品九九久久99
  • <track id="0aiby"><code id="0aiby"><dd id="0aiby"></dd></code></track>

    <ins id="0aiby"></ins>