Cluster là gì? Nguyên tắc hoạt động trong công nghệ máy tính
06/08/2020Cluster là giải pháp đảm bảo cho hệ thống vẫn hoạt động tốt ngay cả khi có sự cố xảy ra đối với máy chủ. Vậy cluster là gì? Nguyên tắc hoạt động của cluster như thế nào? Hãy cùng Viettel IDC tìm hiểu chi tiết thông qua bài viết sau.
Cluster là gì?
Cluster là một hệ thống gồm nhiều máy chủ được kết nối với nhau và hoạt động như một đơn vị thống nhất. Trong trường hợp một máy chủ ngừng hoạt động, toàn bộ công việc mà máy chủ này đảm nhận sẽ được tự động chuyển sang cho một máy chủ khác (trong cùng một cluster) mà không làm cho hoạt động của hệ thống bị ngắt hay gián đoạn. Quá trình này gọi là “fail-over” và việc phục hồi tài nguyên của một máy chủ trong hệ thống (cluster) được gọi là “fail-back”.
Xem thêm:
- Kubernetes là gì? Chức năng và cơ chế hoạt động của k8s
- Node group là gì? Tầm quan trọng trong quản lý Kubernetes
- Kubernetes Pod là gì? Tìm hiểu chi tiết về Kubernetes Pod
Thuật ngữ được dùng trong hệ thống Cluster
Dưới đây là một số thuật ngữ thường gặp khi sử dụng cluster:
- Node: Một máy chủ thuộc một Cluster nào đó.
- Failover: Quá trình chuyển đổi tự động từ node gặp sự cố sang một node bình thường.
- Failback: Quá trình trả lại quyền sở hữu tài nguyên khi một node khắc phục xong sự cố và hoạt động trở lại.
- Quorum Resource: Chứa những cấu hình cần thiết để phục hồi Cluster Resource (Cluster Resource gồm ổ đĩa, network card, địa chỉ IP, ứng dụng và cơ sở dữ liệu của ứng dụng).
- Resource Group: Là một tập hợp các tài nguyên có liên quan chặt chẽ trong một cụm (Cluster). Tập hợp này thường bao gồm các ứng dụng, thiết bị ngoại vi và dữ liệu liên quan đến ứng dụng. Ngoài ra, Resource Group còn có thể chứa các thực thể của cụm như máy chủ ảo và địa chỉ IP khi cần thiết.
Thành phần trong Cluster
- Backup/Restore Manager: Để sao lưu cơ sở dữ liệu của cụm, Cluster cung cấp một API có tên là BackupClusterDatabase. API này sẽ tương tác với thành phần quản lý lỗi để xác định node đang đảm nhiệm vai trò chủ trong cụm. Tiếp theo, yêu cầu sao lưu sẽ được chuyển đến node chủ này. Trên node chủ, hệ thống quản lý cơ sở dữ liệu sẽ được kích hoạt để tạo bản sao lưu cho các file log và file checkpoint của quorum, đây là những file quan trọng để phục hồi cơ sở dữ liệu khi cần.
- Resource Monitor: Đóng vai trò là cầu nối giữa các resource DLLs và Cluster. Khi cần truy xuất thông tin từ một tài nguyên, Resource Monitor sẽ chuyển yêu cầu tới DLL tương ứng. Ngược lại, các DLL sẽ thông báo trạng thái hoặc sự kiện của chúng cho Resource Monitor, và từ đó, thông tin này sẽ được truyền đến dịch vụ Cluster service.
- Node Manager: Giữ nhiệm vụ tìm node lỗi và xác định node nào được thêm hoặc loại bỏ khỏi cluster.
- Checkpoint Manager: Có chức năng đảm bảo cho việc phục hồi từ resource bị lỗi. Khi một tài nguyên được đưa vào hoạt động, trình quản lý này sẽ kiểm tra các khóa đăng ký (registry) liên quan. Nếu tài nguyên bị ngừng hoạt động, trình quản lý sẽ ghi lại thông tin kiểm tra vào tài nguyên quorum để phục hồi dữ liệu sau này.
Xem thêm:
- Kubernetes và Docker khác gì nhau? Nên lựa chọn công nghệ nào?
- Docker là gì? Cách cài đặt và sử dụng docker chi tiết A - Z
- Công nghệ Container là gì? Lợi ích và hạn chế khi sử dụng
Các yêu cầu khi thiết kế và lắp đặt các Cluster
- Yêu cầu về tính sẵn sàng cao (High availability): Các tài nguyên mạng phải luôn sẵn sàng trong khả năng cao nhất để cung cấp và phục vụ các người dùng cuối và giảm thiểu sự ngưng hoạt động hệ thống ngoài ý muốn.
- Yêu cầu về độ tin cậy cao (reliability): Độ tin cậy cao của cluster được hiểu là khả năng giảm thiểu tần số xảy ra các sự cố, và nâng cao khả năng chịu đựng sai sót của hệ thống.
- Yêu cầu về khả năng mở rộng được (scalability): Hệ thống phải có khả năng dễ dàng cho việc nâng cấp, mở rộng trong tương lai. Việc nâng cấp mở rộng bao hàm cả việc thêm các thiết bị, máy tính vào hệ thống để nâng cao chất lượng dịch vụ, cũng như việc thêm số lượng người dùng, thêm ứng dụng, dịch vụ và thêm các tài nguyên mạng khác.
Ba yêu cầu này được gọi tắt là RAS (Reliability-Availability-Scalability), những hệ thống đáp ứng được ba yêu cầu trên được gọi là hệ thống RAS (khác với với Remote Access Service là dịch vụ truy cập từ xa).
Cơ chế hoạt động của Cluster
Mỗi máy chủ trong cluster được gọi là một node (cluster node), và có thể được thiết lập ở chế độ chủ động (active) hay thụ động (passive). Khi một node ở chế dộ chủ động, nó sẽ chủ động xử lý các yêu cầu. Khi một node là thụ động, nó sẽ nằm ở chế độ dự phòng nóng (stanby) chờ để sẵn sàng thay thế cho một node khác nếu bị hỏng.
Trong một Cluster có nhiều node có thể kết hợp cả node chủ động và node thụ động. Trong những mô hình loại này việc quyết định một node được cấu hình là chủ động hay thụ động rất quan trọng. Để hiểu lý do tại sao, hãy xem xét các tình huống sau:
- Nếu một node chủ động bị sự cố và có một node thụ động đang sẵn sàng, các ứng dụng và dịch vụ đang chạy trên node hỏng có thể lập tức được chuyển sang node thụ động. Vì máy chủ đóng vai trò node thụ động hiện tại chưa chạy ứng dụng hay dịch vụ gì cả nên nó có thể gánh toàn bộ công việc của máy chủ hỏng mà không ảnh hưởng gì đến các ứng dụng và dịch vụ cung cấp cho người dùng cuối (Ngầm định rằng các các máy chủ trong cluster có cấu trúc phần cứng giống nhau).
- Nếu tất cả các máy chủ trong cluster là chủ động và có một node bị sự cố, các ứng dụng và dịch vụ đang chạy trên máy chủ hỏng sẽ phải chuyển sang một máy chủ khác cũng đóng vai trò node chủ động. Vì là node chủ động nên bình thường máy chủ này cũng phải đảm nhận một số ứng dụng hay dịch vụ gì đó, khi có sự cố xảy ra thì nó sẽ phải gánh thêm công việc của máy chủ hỏng. Do vậy để đảm bảo hệ thống hoạt động bình thường kể cả khi có sự cố thì máy chủ trong Cluster cần phải có cấu hình dư ra đủ để có thể gánh thêm khối lượng công việc của máy chủ khác khi cần.
Trong cấu trúc Cluster mà mỗi node chủ động được dự phòng bởi một node thụ động, các máy chủ cần có cấu hình sao cho với khối lượng công việc trung bình chúng sử dụng hết khoảng 50% CPU và dung lượng bộ nhớ.
Trong cấu trúc Cluster mà số node chủ động nhiều hơn số node bị động, các máy chủ cần có cấu hình tài nguyên CPU và bộ nhớ mạnh hơn nữa để có thể xử lý được khối lượng công việc cần thiết khi một node nào đó bị hỏng.
Các node trong một cluster thường là một bộ phận của cùng một vùng (domain) và có thể được cấu hình là máy điều khiển vùng (domain controllers) hay máy chủ thành viên. Lý tưởng nhất là mỗi Cluster nhiều node có ít nhất hai node làm máy điều khiển vùng và đảm nhiệm việc failover đối với những dịch vụ vùng thiết yếu. Nếu không như vậy thì khả năng sẵn sàng của các tài nguyên trên cluster sẽ bị phụ thuộc vào khả năng sẵn sàng của các máy điều khiển trong domain.
Nhờ những tính năng vượt trội như vậy, công nghệ Cluster đã được áp dụng vào trong các máy chủ, giúp cho việc quản trị dữ liệu được tự động, an toàn và có thể dễ dàng phục hồi khi xảy ra sự cố.
Ứng dụng của Cluster trong quản trị cơ sở dữ liệu
Cluster được dùng cho các ứng dụng Stateful applications (các ứng dụng hoạt động thường xuyên trong thời gian dài) bao gồm các database server như là Microsoft MySQL Server, Microsoft Exchange Server, File and Print Server,…
Tất cả các node trong Cluster dùng chung 1 nơi lưu trữ dữ liệu có thể dùng công nghệ SCSI hoặc Storage Area Network (SAN). Windows Sever 2003 Enterprise và Datacenter hỗ trợ cluster lên đến 8 node trong khi đó Windows 2000 Advance Server hỗ trợ 2 node còn Windows 2000 Datacenter Server được 4 node.
Trong thời đại số hoá hiện nay, khi doanh nghiệp quản trị database hiệu quả, các nguồn lực sẽ được tối ưu, các quy trình sẽ được tinh gọn đồng thời gia tăng hiệu suất làm việc của tất cả các nhân viên.
Vì vậy mà Viettel IDC đã nghiên cứu và phát triển hoàn thiện dịch vụ Viettel Database Service, giúp các doanh nghiệp quản trị database một cách nhanh chóng, tiện lợi, an toàn.
Để được tư vấn chi tiết về dịch vụ phù hợp với nhu cầu thực tế, vui lòng liên hệ đến Viettel IDC:
- Hotline: 1800.8088 (miễn phí cước gọi)
- Fanpage: https://www.facebook.com/viettelidc
- Website: https://viettelidc.com.vn
Tin nổi bật
Có nên sử dụng cheap VPS Windows không?
23/07/2025Tin liên quan
Bí quyết tăng tốc website nhanh chóng và dễ dàng
Trong bài viết này, Viettel IDC sẽ hướng dẫn bạn những bí quyết giúp tăng tốc website nhanh chóng và hiệu quả, giúp tối ưu hiệu suất, tốc độ website của mình, hãy cùng điểm qua nhé.
9 lý do doanh nghiệp cần chuyển từ VPS lên Cloud Server
Đều là máy chủ ảo nhưng hiện nay, Cloud Server đang được đánh giá cao hơn khi mang đến nhiều lợi ích vượt trội so với dịch vụ VPS.
Ảo hóa máy chủ là gì? Tìm hiểu về ảo hóa VMWare
Ảo hóa đang là một trong những xu hướng hot hiện nay, và ảo hóa máy chủ cũng không ngoại lệ. Công nghệ này giúp chúng ta tiết kiệm chi phí và mang lại sự tiện lợi tối ưu. Trong bài viết này, Viettel IDC sẽ giới thiệu đến bạn khái niệm về ảo hóa máy chủ là gì, công nghệ VMWare có gì hot nhé! Hãy cùng Viettel IDC tìm hiểu kỹ hơn về các vấn đề này.
Có nên sử dụng cheap VPS Windows không?
Dịch vụ máy chủ ảo VPS đang là một trong những lựa chọn phổ biến của nhiều doanh nghiệp và cá nhân hiện nay. Cùng với nhu cầu đó, nhiều cheap VPS Windows đã được ra đời để phục vụ nhu cầu cho người dùng. Tuy nhiên, chúng ta có nên sử dụng cheap VPS Windows hay không? Chúng có chất lượng đủ ổn định để đáp ứng nhu cầu của chúng ta không? Hãy cùng Viettel IDC tìm hiểu kỹ hơn thông qua bài viết bên dưới nhé!
NLP là gì? Tìm hiểu về lập trình ngôn ngữ tư duy
NLP - Natural Language Processing (lập trình ngôn ngữ tư duy) là một nhánh của trí tuệ nhân tạo (AI), giúp máy tính nhận diện, hiểu và tạo ra văn bản hoặc lời nói giống như con người.
Mã hóa đầu cuối là gì? Cách thức hoạt động và ưu nhược điểm
Mã hóa đầu cuối, hay End-to-End Encryption (E2EE) là thuật ngữ mô tả quá trình dữ liệu được mã hoá khi rời khỏi thiết bị của người dùng, hoặc trước khi được truyền đi/lưu trữ ở một nơi bất kỳ
Cloud Adoption là gì? Lưu ý khi lựa chọn cho doanh nghiệp
Cloud Adoption là quá trình doanh nghiệp chuyển đổi từ việc sử dụng cơ sở hạ tầng CNTT truyền thống sang sử dụng các dịch vụ điện toán đám mây bao gồm việc lưu trữ dữ liệu, vận hành
Dịch vụ thuê kênh riêng quốc tế IPLC tin cậy, hiệu quả
IPLC (International Private Leased Circuit), hay kênh thuê riêng quốc tế là dịch vụ cung cấp kết nối mạng trực tiếp và riêng tư giữa hai địa điểm khác nhau, thường là hai quốc gia, lãnh thổ
So sánh sự khác nhau giữ băng thông và độ trễ
Băng thông và độ trễ đóng vai trò then chốt trong việc đánh giá và tối ưu hiệu suất mạng. Nhưng bạn đã thực sự hiểu rõ sự khác biệt giữa hai yếu tố này chưa?
Virtual Desktop là gì? Vai trò và tầm quan trọng
Virtual Desktop là một không gian làm việc ảo, không chạy trực tiếp trên phần cứng của thiết bị người dùng mà thay vào đó hoạt động thông qua phần mềm cài đặt trên thiết bị đó