Đặng Đình Hưng
039******* ****************@***.***.** https://github.com/Harmonic2004
Education
Trường Đại học Khoa học Tự nhiên, Đại học Quốc gia Hà Nội Hà Nội, Việt Nam Khoa học dữ liệu; GPA: 3.2/4.00 Tháng 6 năm 2022 – Tháng 6 năm 2026 Projects
Tối ưu hóa danh mục đầu tư Vòng chung kết cuộc thi DataFlow 2025
• Phân tích và xây dựng danh mục đầu tư trên thị trường chứng khoán Việt Nam từ dữ liệu CafeF và VietStock.
• Thu thập và xử lý dữ liệu lịch sử, volume và các chỉ số tài chính của các mã cổ phiếu đại diện ngành.
• Lọc và xếp hạng cổ phiếu dựa trên P/E, ROE, Debt Ratio để chọn các mã có nền tảng tốt.
• Áp dụng Modern Portfolio Theory kết hợp với VaR, CAGR để tối ưu lợi nhuận và rủi ro.
• So sánh hiệu quả đầu tư với benchmark và danh mục truyền thống, trực quan hóa bằng biểu đồ.
• Công nghệ: Python, Pandas, Scikit-learn, Matplotlib, Selenium, Scipy.
• GitHub: Portfolio-Investment
Forecasting Business Performance Cuộc thi DataFlow 2025 2025
• Xây dựng pipeline ELT để xử lý và dự đoán doanh thu cho chuỗi bán lẻ tại Mỹ từ dữ liệu Excel thô.
• Dữ liệu lưu tại PostgreSQL (Data Lake), xử lý bằng PySpark và Snowflake, chuẩn hóa qua dbt.
• Xây dựng dashboard tương tác bằng Apache Superset để theo dõi xu hướng doanh thu, lợi nhuận.
• Dự báo kết quả kinh doanh bằng mô hình ARIMA và XGBoost, hỗ trợ ra quyết định chiến lược.
• Công nghệ: Docker, PySpark, dbt, Snowflake, PostgreSQL, Superset, Pandas, Matplotlib, Numpy.
• GitHub: FORECASTING-BUSINESS-PERFORMANCE
Predict-Phone-Price Using Lambda Architecture Dự án kết thúc khóa BigData SamSung 2024
• Áp dụng kiến trúc Lambda kết hợp xử lý real-time và batch để dự đoán giá smartphone.
• Crawl dữ liệu từ ClickBuy và Điện Thoại Giá Kho bằng Selenium, xử lý và gửi qua Kafka.
• Dự đoán giá theo luồng bằng XGBoost, lưu kết quả vào HBase cho truy xuất real-time.
• Dữ liệu batch lưu trên HDFS, xử lý bằng PySpark, lưu trữ dài hạn tại PostgreSQL.
• Trực quan hóa bằng web Flask (real-time) và Power BI (historical dashboard).
• Công nghệ: Kafka, Spark, XGBoost, HBase, PostgreSQL, Flask, Power BI.
• GitHub: Predict-Phone-Price
Technical Skills
Languages: Java, Python, SQL (Postgres), R
Frameworks: Apache Hadoop, Apache Spark, Apache Kafka, Apache Superset, Data Build Tool Developer Tools: Git, Docker, VS Code
Libraries: pandas, NumPy, Matplotlib
Honors and Awards
Chứng chỉ Big Data – Samsung Innovation Campus 2024 Hoàn thành khóa học chuyên sâu về công nghệ và kiến trúc Big Data Giải Khuyến Khích – Cuộc thi DataFlow 2025 2025
Phân tích dữ liệu các bài toán kinh tế, tài chính bằng công cụ và kỹ thuật Khoa học dữ liệu