大數據架構師的職責
大數據架構師的職責
大數據架構師負責大數據倉庫、數據集市的規劃及實現,負責大數據中臺的設計和核心開發工作。下面是學習啦小編為您精心整理的大數據架構師的職責。
大數據架構師的職責1
職責:
1、負責大數據基礎平臺、海量數據存儲處理分布式平臺、數據分析系統架構設計和研發;
2、負責實時計算平臺基礎架構設計、部署、監控、優化升級;
3、制定項目數據倉庫設計及實現規范,指導設計研發和部署;
4、協助策略和算法團隊工作,保障數據挖掘建模和工程化;
5、深入研究大數據相關技術和產品,跟進業界先進技術。
任職要求:
1、3年以上大數據系統架構經驗;
2、精通Hadoop HBase Hive Spark Flink Kafka Redis技術及其生態圈;
3、具備Java Scala Python等開發經驗,熟悉數據挖掘和分析的策略與算法;
4、精通數據抽取,海量數據傳輸,數據清洗的常用方法和工具。
5、具備良好的系統分析能力、故障診斷能力;
6、有大數據策略、算法、可視化經驗優先;
7、有在華為云存儲產品和大數據產品的開發使用經驗優先。
大數據架構師的職責2
職責:
1、負責公司的大數據平臺的數倉架構、系統架構設計;
2、負責帶領團隊完成輿情分析相關的挖掘方案設計;
3、負責大數據研發組團隊管理;
4、負責帶領團隊完成輿情平臺的方案文檔撰寫、迭代開發;
5、負責研發規范制定,研究行業前沿技術;
6、參與產品規劃及設計討論。
任職要求:
1、本科五年工作經驗及以上,有至少五年的大數據技術實踐經驗,有NLP或AI相關經驗;
2、有很強的架構設計能力和良好的表達能力;
3、有一定的項目管理及團隊管理能力;
4、精通Hadoop、Spark生態圈中的常用組件原理及應用;
6、理解媒體業務,精通數據倉庫的規劃和設計;
5、精通掌握Java或Python編程,有性能調優能力;
4、熟悉NLP算法原理及應用;
6、對新生事物或者新技術有濃厚興趣,學習能力強。
大數據架構師的職責3
職責
1、參與打造數據中內容的規劃、設計、開發和優化工作,實現高質量數據的互通與共享;
2、參與數據模型體系構建及數據主題設計和開發,搭建離線、實時數據公共層;
3、參與數據產品與應用的數據研發,發掘數據商業價值,打造極致體驗的數據產品;
4、深入理解數據產品的使用場景,為業務方在可用性、成本上做更好的設計做參考;
5、團隊成員的搭建與培養,任務劃分,進度監控,代碼規范,質量保證。
任職要求
1、熟悉數據倉庫建模理論,3年以上相關領域實踐經驗;
2、Hadoop、Hive、Hbase、Storm、Spark等技術框架;
3、精通Java、Python、Scala、go等開發語言中的1到2種;
4、熟練使用Python/Java/scala或其他語言進行復雜業務邏輯的數據處理工作,具備海量數據處理以及性能優化的能力;
5、對MySQL、Redis、HBase等數據庫有一定的了解和使用經驗;
6、對olap,多維分析及kylin熟悉的更好;
7、思路清晰,具備良好的溝通能力和理解能力,較強的學習能力以及快速解決問題的能力;
8、對新技術,新事物有很好的探索和求知欲;
9、熟悉常規的機器學習算法:降維(PCA、SVD)、SVM、邏輯回歸(LogisticsRegression)、決策樹(GBDT、RandomForest)、關聯規則(Apriori、FP-Growth)、聚類(K-Means)等優先。
大數據架構師的職責4
職責
1、負責公司大數據平臺的整體架構設計,包含數據收集、數據存儲、數據挖掘、數據輸出;
2、負責規劃從數據源到數據應用的整體流程,并參與用戶產品和數據產品的決策;
3、負責海量數據分析、用戶行為分析,構建用戶數據模型;
4、負責解決核心技術問題,對技術方案進行決策;
5、技術團隊管理。
6、熟悉手機IOS、安卓系統APP開發
任職資格
1、計算機相關專業畢業,本科以上學歷;
2、5年以上相關工作經驗,具備軟件產品架構設計經驗,熟練掌握高性能、高擴展性架構設計方法;
3、熟練掌握java或c++任意一門語言、熟悉linux操作系統;
4、熟悉Hadoop/MR/Hbase/Mahout/Spark等大數據技術,并能夠基于上述項目開發大數據相關應用;
5、熟悉基本數據挖掘方法和技術;
6、強烈的敬業精神,良好的溝通與協調能力,能有效組織協調團隊完成各類開發工作;
7、熱愛技術,相信數據的價值,對大數據有深刻的理解。
大數據架構師的職責5
職責:
1、負責規劃科技大數據平臺及科技數據入庫自動化的方案設計;
2、負責大數據平臺的開發和維護,以及對外服務接口的開發;
3、負責大數據平臺的優化和改進工作。
任職要求
1、計算機相關專業本科及以上學歷,5年以上開發經驗,其中3年以上為互聯網、大數據相關的開發經驗;
2、熟知Hadoop生態圈體系,精通Hadoop/Spark/Storm/Kafka中的一項或幾項,深刻理解MapReduce的運行原理和機制,有MPI經驗者尚佳;
3、熟悉Elasticsearch、Redis、Hbased等相關數據庫的構建和操作,尤其是數據庫集群的構建和操作,熟悉Neo4j者尚佳;
4、具有機器學習相關項目經驗者優先。