Post Job Free
Sign in

Data Analyst Intern

Location:
Hanoi, Vietnam
Posted:
June 19, 2025

Contact this candidate

Resume:

Đặng Đình Hưng

039******* ****************@***.***.** https://github.com/Harmonic2004

Education

Trường Đại học Khoa học Tự nhiên, Đại học Quốc gia Hà Nội Hà Nội, Việt Nam Khoa học dữ liệu; GPA: 3.2/4.00 Tháng 6 năm 2022 – Tháng 6 năm 2026 Projects

Tối ưu hóa danh mục đầu tư Vòng chung kết cuộc thi DataFlow 2025

• Phân tích và xây dựng danh mục đầu tư trên thị trường chứng khoán Việt Nam từ dữ liệu CafeF và VietStock.

• Thu thập và xử lý dữ liệu lịch sử, volume và các chỉ số tài chính của các mã cổ phiếu đại diện ngành.

• Lọc và xếp hạng cổ phiếu dựa trên P/E, ROE, Debt Ratio để chọn các mã có nền tảng tốt.

• Áp dụng Modern Portfolio Theory kết hợp với VaR, CAGR để tối ưu lợi nhuận và rủi ro.

• So sánh hiệu quả đầu tư với benchmark và danh mục truyền thống, trực quan hóa bằng biểu đồ.

• Công nghệ: Python, Pandas, Scikit-learn, Matplotlib, Selenium, Scipy.

• GitHub: Portfolio-Investment

Forecasting Business Performance Cuộc thi DataFlow 2025 2025

• Xây dựng pipeline ELT để xử lý và dự đoán doanh thu cho chuỗi bán lẻ tại Mỹ từ dữ liệu Excel thô.

• Dữ liệu lưu tại PostgreSQL (Data Lake), xử lý bằng PySpark và Snowflake, chuẩn hóa qua dbt.

• Xây dựng dashboard tương tác bằng Apache Superset để theo dõi xu hướng doanh thu, lợi nhuận.

• Dự báo kết quả kinh doanh bằng mô hình ARIMA và XGBoost, hỗ trợ ra quyết định chiến lược.

• Công nghệ: Docker, PySpark, dbt, Snowflake, PostgreSQL, Superset, Pandas, Matplotlib, Numpy.

• GitHub: FORECASTING-BUSINESS-PERFORMANCE

Predict-Phone-Price Using Lambda Architecture Dự án kết thúc khóa BigData SamSung 2024

• Áp dụng kiến trúc Lambda kết hợp xử lý real-time và batch để dự đoán giá smartphone.

• Crawl dữ liệu từ ClickBuy và Điện Thoại Giá Kho bằng Selenium, xử lý và gửi qua Kafka.

• Dự đoán giá theo luồng bằng XGBoost, lưu kết quả vào HBase cho truy xuất real-time.

• Dữ liệu batch lưu trên HDFS, xử lý bằng PySpark, lưu trữ dài hạn tại PostgreSQL.

• Trực quan hóa bằng web Flask (real-time) và Power BI (historical dashboard).

• Công nghệ: Kafka, Spark, XGBoost, HBase, PostgreSQL, Flask, Power BI.

• GitHub: Predict-Phone-Price

Technical Skills

Languages: Java, Python, SQL (Postgres), R

Frameworks: Apache Hadoop, Apache Spark, Apache Kafka, Apache Superset, Data Build Tool Developer Tools: Git, Docker, VS Code

Libraries: pandas, NumPy, Matplotlib

Honors and Awards

Chứng chỉ Big Data – Samsung Innovation Campus 2024 Hoàn thành khóa học chuyên sâu về công nghệ và kiến trúc Big Data Giải Khuyến Khích – Cuộc thi DataFlow 2025 2025

Phân tích dữ liệu các bài toán kinh tế, tài chính bằng công cụ và kỹ thuật Khoa học dữ liệu



Contact this candidate