日韩精品一区二_av在线色_中文二区_日本成人三级_a免费在线观看_国产精品久久久久久久久久久久久久久

當前位置:高考升學網 > 招聘筆試題 > 正文

2019百度校招數據挖掘工程師筆試題和面試題答案目

更新:2023-09-16 11:59:33 高考升學網

  筆試時間:2015-9-20

  筆試職位:機器學習/數據挖掘工程師

  筆試城市:天津、深圳、南京等

  一. 簡答題

  1. new 和 malloc 的區別。

  2. hash沖突是指什么?怎么解決?給兩種方法,寫出過程和優缺點。

  3. 命中的概率是 0.25,若要至少命中一次的概率不小于 0.75,則至少需要幾次?

  二. 算法設計題

  1. 用C/C++寫一個歸并排序。

  數據結構為struct Node{int v; Node next};

  接口為 Node merge_sort(Node );

  2. 設計S型層次遍歷樹的算法,比如根節點是第一層,第二層從左至右遍歷,第三層從右至左遍歷,第四層再從左至右遍歷,以此類推。

  舉例:應依次輸出 1 2 3 6 5 4 7 8 9。

  3. 一個url文件,每行是一個url地址,可能有重復。

  (1)統計每個url的頻次,設計函數實現實現。

  (2)設有10億url,均長度是20,現在機器有8G內存,怎么處理,寫出思路。

  三. 系統設計題

  自然語言處理中的中文分詞問題,前向最大匹配算法(FMM)。

  注:題目舉例說明了FMM的基本。

  (1)設計字典的數據結構 struct dictnote。

  (2)用C/C++實現FMM,可選接口為

  int FMM(vector iLetters, dictnode iRoot, vector oResults);

  其中 iLetters 為待分詞的句子,比如 {“小”,“明”,“今”,“天”,“買”,“了”,“i”,“p”,“o”,“n”,“e”,“6”},

  iRoot 是字典, oResults 保存輸出結果,即分詞的位置。也可以自己設計接口。

  (3)收集了一些手機品牌的字典,如{iphone, 諾基亞}。

  現在要求查找包含這些手機品牌的網頁,比如包含 iphone6, 諾基亞 9973 等。

  怎么修改FMM實現這個功能,可以寫偽代碼。

最新圖文

2020年河北新聞網兩學一做

時間:2023-09-18 07:0:24

2020年河北新聞網兩學一做

時間:2023-09-15 11:0:59

兩學一做學習教育知

時間:2023-09-21 06:0:30

2020年開展兩學一做學習教

時間:2023-09-19 21:0:30
主站蜘蛛池模板: 夜夜夜久久 | 91社区在线观看高清 | 国产不卡在线观看 | 久久久精品日本 | 91精品综合久久久久久五月天 | 夜夜av | 日韩在线观看中文字幕 | 日韩成人一区二区 | 日本久久精品视频 | 国产情品 | 青青久久 | 夜夜天天操 | 亚洲a级| 欧美日韩一区二区视频在线观看 | 国产一级一级 | 天天干天天操天天爽 | 精品欧美一区二区三区 | 日韩在线中文 | 二区视频| 美日韩一区二区三区 | 在线视频一区二区 | 特级黄一级播放 | 久久一| 国产人妖视频 | 久草在线资源福利站 | 欧美成人一区二区三区片免费 | 精品三区 | 91性高湖久久久久久久久网站 | 欧美福利一区二区 | 国产成人中文字幕 | 亚洲成人一区二区 | 日韩av一区二区三区四区 | 欧美日韩在线免费观看 | 成年免费观看视频 | 国产高清在线精品一区二区三区 | 狠狠干狠狠操 | 成人免费观看49www在线观看 | 91精品国产乱码久久久久久久久 | 亚洲国产一区二区三区在线观看 | 国产九九精品视频 | 国产精品96久久久久久久 |