banner

Vào tối thứ Sáu – ngày 19/6, FUNiX sẽ tổ chức xTalk với chủ đề “Công việc của một Big Data Engineer” với sự tham gia của anh Phan Chương – hiện làm Big Data Engineer ở T-Mobile trong vai trò diễn giả.

T-Mobile là một trong ba nhà mạng viễn thông lớn nhất ở Mỹ, với gần 100 triệu người dùng. Đây cũng là nhà mạng không dây số một của Mỹ, phủ sóng tới 98% người dân.

Trong vai trò là Big Data Engineer của T-Mobile, anh Phan Chương có mặt trong nhóm chuyên về phân tích dữ liệu cả nghìn gigabyte của thuê bao để phục vụ cho công tác Marketing. Từ fresher mới ra trường đến một lập trình viên Big Data “là một quãng đường khá dài và lòng vòng” – như lời anh Chương chia sẻ. Anh hy vọng việc nói về công việc thực tế hàng ngày của chính mình sẽ giúp các bạn sinh viên FUNiX, hoặc những ai đang có ý định chuyển sang “ngạch” Big Data có một cái nhìn cụ thể hơn.

Đặc biệt, ngày 24/6, anh Phan Chương sẽ tham gia phát biểu tại Hội thảo Spark + AI Summit 2020 – diễn đàn lớn nhất và sôi nổi nhất về công nghệ Apache Spark và các ứng dụng của nó trong Big Data và Trí tuệ nhân tạo. Chủ đề bài phát biểu của anh xoay quanh việc xử lý dữ liệu rất lớn ở T-Mobile, sử dụng Apache Spark để phát hiện gian dối trong lĩnh vực quảng cáo. “Khi nhận được tin là sẽ được phát biểu chính thức, mình đã nghĩ ngay đến FUNiX, là sao mình không thử chia sẻ những cái mình biết cho các bạn học viên bằng tiếng Việt để mọi người dễ tiếp cận? Và thế là nảy ra ý tưởng về buổi xTalk này” – anh Chương cho biết.

Làm việc trong lĩnh vực Big Data đã 4 năm, anh Phan Chương cho rằng, để đi theo con đường này mà không bị lãng phí thời gian, thì mỗi người cần có định hướng rõ ràng ngay từ đầu, thay vì học lan man hết ngôn ngữ này đến nền tảng khác. Anh gợi ý, những điều kiện cơ bản để theo đuổi ngành BigData gồm khả năng đọc tài liệu bằng tiếng Anh; kiến thức về SQL – nền tảng của dữ liệu; Kiến thức về Python – ngôn ngữ lập trình của giới chuyên gia về dữ liệu, có rất nhiều thư viện hỗ trợ và quan trọng hơn hết là Python rất đơn giản để bắt đầu. Bên cạnh đó, anh cũng khuyên bạn nên tìm hiểu thêm Apache Spark – nền tảng của các chương trình xử lý dữ liệu lớn cũng như trí tuệ nhân tạo và đầu tư chút thời gian vào môn toán thống kê (statistics) để có chút kiến thức về dữ liệu nếu có thể, sẽ giúp ích rất nhiều sau này.

Anh Phan Chương là cựu sinh viên FUNiX, người đã nhận được bằng đại học ngành CNTT sau 20 tháng học tại FUNiX. Trong khuôn khổ xTalk “Công việc của một Big Data Engineer” tối ngày 19/6, các nội dung chính mà anh Phan Chương dự định chia sẻ gồm có: Các lựa chọn công việc liên quan đến Big Data; Thực tế công việc về Big Data ở T-Mobile; Sơ lược về Distributed Computing và Hadoop; Spark, PySpark giúp gì cho lập trình viên.

Link đăng ký chương trình tại đây: https://docs.google.com/forms/d/e/