Sự cố máy tính lớn nhất trong lịch sử

|

Ngày 19/7, sự cố sập hệ thống máy tính có liên quan hệ điều hành Windows của Microsoft đã khiến hàng loạt sân bay, siêu thị, ngân hàng... trên khắp thế giới chịu tổn thất nặng nề. Vụ việc này đã phơi bày sự mong manh của hệ thống internet toàn cầu cũng như sự phụ thuộc quá nhiều của tổ chức và doanh nghiệp vào hạ tầng viễn thông.

Sự bất cẩn của CrowdStrike

Ngày 19/7, Microsoft thông báo nền tảng điện toán đám mây Azure của công ty an ninh mạng CrowdStrike, đối tác của Microsoft, đã gián đoạn hoạt động. Azure là nền tảng chuyên cung cấp các dịch vụ xây dựng, triển khai và quản lý các ứng dụng và dịch vụ. Sự cố bắt đầu xảy ra vào khoảng 18 giờ (giờ địa phương) ngày 18/7 đã tạo ra khung cảnh hỗn loạn tại các sân bay miền trung nước Mỹ, khiến hàng trăm chuyến bay bị hoãn và hủy.

Trong một thông báo gửi đến khách hàng chiều 19/7, CrowdStrike xác nhận nguyên nhân sự cố xuất phát từ lỗi trong hệ thống của công ty. Người phát ngôn công ty cho biết: “CrowdStrike đã nhận được báo cáo về sự cố trên máy chủ Windows liên quan Falcon Sensor - phần mềm bảo vệ máy tính trước các cuộc tấn công mạng của chúng tôi”. Theo đó, bản cập nhật cho Falcon đã khiến phần mềm trục trặc, làm cho các máy tính Windows 10 bị treo và không khởi động lại được, hiển thị lỗi “màn hình xanh chết chóc”.

Ngay khi sự cố xảy ra, Microsoft cho biết, tập đoàn đã tiến hành khắc phục vấn đề song tình trạng gián đoạn các hoạt động nói trên vẫn tiếp diễn nhiều giờ sau đó. Microsoft cũng cho rằng, vấn đề này xảy ra có liên quan một thỏa thuận năm 2009 của Ủy ban châu Âu (EC). Thỏa thuận này nhằm mục đích thúc đẩy cạnh tranh, yêu cầu Microsoft phải cung cấp cho các nhà phát triển phần mềm bảo mật bên thứ ba cùng mức độ truy cập vào Windows như chính công ty.

Đây được cho là sự cố nghiêm trọng khi hơn một nửa công ty trong danh sách “Fortune 500” (500 công ty lớn nhất của Mỹ được xếp hạng theo tổng doanh thu cho các năm tài chính tương ứng) dùng phần mềm nói trên, bao gồm cả Cơ quan An ninh mạng và Cơ sở hạ tầng Mỹ. Phần mềm Falcon cũng được sử dụng rộng rãi tại 170 quốc gia trên thế giới. Theo thống kê từ Microsoft, sự cố CrowdStrike gây ảnh hưởng khoảng 8,5 triệu máy móc chạy hệ điều hành Windows trên toàn cầu. Tập đoàn này cũng thừa nhận, sự việc đã tác động lớn đến xã hội và kinh tế.

Ước tính, du lịch là ngành chịu ảnh hưởng nặng nề nhất bởi hành khách ở các sân bay không thể làm các thủ tục như ký gửi hành lý hay quẹt thẻ lên máy bay tự động. Thậm chí nhiều chuyến bay đã phải hủy bỏ hoặc hoãn do các vấn đề kỹ thuật. Tính đến chiều 19/7 (giờ địa phương), sự cố này đã khiến khoảng hơn 33.000 chuyến bay trên toàn thế giới bị hoãn, hơn 3.800 chuyến bị hủy, trong đó các chuyến bay bị hoãn tại Mỹ là hơn 7.000 chuyến và bị hủy hơn 2.400 chuyến.

Ngoài ra, tại các siêu thị ở Australia, sự cố cũng khiến các nhân viên thu ngân không thể thực hiện việc thanh toán. Công ty viễn thông Telstra của nước này cũng cho biết, hệ thống liên lạc bị gián đoạn, gây ra một số chậm trễ cho khách hàng. Tại Anh, hệ thống đặt chỗ của các bệnh viện, phòng khám đã bị treo.

Sky News, một trong những đài truyền hình lớn của đất nước đã ngừng phát sóng, xin lỗi vì không thể truyền hình trực tiếp. Trên tài khoản mạng xã hội X, câu lạc bộ bóng đá nước Anh Manchester United đã phải thông báo hoãn lịch phát hành vé.

Lỗi “màn hình xanh chết chóc”. Ảnh: CBC

Những tác động lâu dài

Sau sự cố, trong một bài đăng trên mạng xã hội X, chuyên gia bảo mật Troy Hunt khẳng định: “Tôi không nghĩ còn quá sớm để gọi đây là vụ sập công nghệ thông tin (IT) lớn nhất trong lịch sử”. Đồng tình với quan điểm trên, các nhà phân tích thế giới cũng nhận định đây có thể là lỗi mất kết nối lớn nhất và có tính “tàn phá” khủng khiếp nhất từ trước đến nay.

Chia sẻ với Reuters, ông Ajay Unni, Tổng Giám đốc điều hành (CEO) StickmanCyber - một trong những công ty dịch vụ an ninh mạng lớn nhất Australia cho biết: “Các công cụ bảo mật thông tin được tạo ra để giúp công ty vẫn hoạt động được khi bị tấn công dữ liệu. Nhưng nếu chính những công cụ này là nguyên nhân gây ra sự cố, làm sập hệ thống kết nối internet trên toàn cầu, đó sẽ là thảm họa không thể tránh được”.

Trong khi đó, sau cuộc họp Cơ chế Điều phối quốc gia, trong một tuyên bố đăng trên mạng xã hội , Bộ trưởng Nội vụ Australia Clare O’Neil nêu rõ, dù sự cố lần này không gây tác động nào đến các cơ sở hạ tầng quan trọng hoặc các dịch vụ của chính phủ, song nước này “có rất nhiều việc phải làm” trong những ngày tới để đưa nền kinh tế hoạt động trở lại. Ông đánh giá, cần ít nhất hai tuần để tất cả các lĩnh vực bị ảnh hưởng có thể khôi phục hoàn toàn hoạt động.

Trao đổi với CNN, nhà nghiên cứu bảo mật độc lập chuyên về an ninh mạng Kenn White đánh giá, việc phục hồi hoạt động sau sự cố vừa qua sẽ vô cùng tốn kém đối với các công ty thuộc danh sách “Fortune 500” có đội ngũ nhân viên công nghệ thông tin đông đảo và thậm chí còn khó khăn hơn đối với các công ty nhỏ. “Nếu các công ty nhỏ không có nhân viên công nghệ thông tin có thể thật sự tiếp cận vào máy tính tại chỗ, thì việc này sẽ mất rất nhiều ngày để phần lớn các công ty ở Mỹ có thể phục hồi. Mất rất nhiều công sức cho một việc thủ công như vậy”, ông White khẳng định.

Nhiều chuyên gia trong lĩnh vực công nghệ thông tin cũng có những chia sẻ đồng quan điểm, cho rằng có thể phải mất hàng triệu giờ làm việc của các nhân viên IT khi họ phải tới các công ty để sửa chữa tất cả các máy tính bị ảnh hưởng. “Trong trường hợp các nhân viên không thể tới từng bàn làm việc để sửa từng máy tính, họ sẽ phải hướng dẫn về quy trình từ xa cho những người bị ảnh hưởng. Đó là một quy trình khá phức tạp đối với những người không rành về kỹ thuật và thậm chí nhiều chuyên gia lành nghề cũng sẽ gặp khó khăn khi thực hiện việc này ở quy mô lớn với số lượng máy bị ảnh hưởng. Kết quả là, quá trình này còn mất thời gian và nhân lực hơn nữa”, một chuyên gia trong lĩnh vực IT cho biết. Chuyên gia an ninh mạng Andrew Peck đến từ Trường đại học Loughborough (Anh) ước tính việc khắc phục sự cố sẽ tốn hàng tỷ USD.

Không chỉ về vấn đề nhân lực và tiền bạc, ngày 20/7, Cục Tín hiệu Australia (ASD) - cơ quan tình báo mạng của nước này - cảnh báo “các trang web độc hại và mã không chính thức” đang được phát tán trực tuyến với quảng cáo là hỗ trợ phục hồi sau sự cố “sập đám mây” của Microsoft. Trên trang web của mình, ASD tuyên bố: “Một số trang web độc hại và mã không chính thức đang được phát tán với mục đích giúp các tổ chức phục hồi hoạt động sau sự cố kỹ thuật CrowdStrike gây ra”. Cơ quan này khuyến nghị người tiêu dùng chỉ lấy thông tin kỹ thuật và cập nhật từ các nguồn chính thức của CrowdStrike.

Theo CNN, sự cố nghiêm trọng vừa qua của Microsoft đã một lần nữa khẳng định vai trò quan trọng của việc duy trì hệ thống công nghệ thông tin ổn định và đáng tin cậy trong thời đại số hóa hiện nay. Vụ việc này cũng cho thấy mức độ phụ thuộc ngày càng tăng của các doanh nghiệp và tổ chức vào các dịch vụ trên internet cũng như nguy cơ tiềm ẩn khi hệ thống gặp trục trặc, từ đó, đòi hỏi giới chức thế giới cần chuẩn bị sẵn những phương án dự phòng đối với sự cố tương tự trong tương lai.