Spotlights
Kỹ sư SRE, Kỹ sư DevOps (SRE), Kỹ sư độ tin cậy hệ thống, Kỹ sư vận hành (SRE), Kỹ sư cơ sở hạ tầng (SRE), Kỹ sư vận hành công trường, Kỹ sư sản xuất (SRE), Kỹ sư nền tảng (SRE), Kỹ sư tính khả dụng của trang web, Kỹ sư độ tin cậy
Trước khi DevOps ra đời, Google đã gặp sự cố và không biết cách khắc phục. Công ty đã điều hành các trang web lớn nhưng cần phải cải thiện chúng và mở rộng quy mô chúng hơn nữa. Giải pháp của nó? Google đã gắn thẻ một nhóm kỹ sư phần mềm để tìm ra nó và từ những nỗ lực của họ đã tạo ra nền tảng của Kỹ thuật độ tin cậy của trang web (SRE). Ngày nay, gã khổng lồ phần mềm định nghĩa SRE là "những gì bạn nhận được khi bạn xử lý các hoạt động như thể đó là một vấn đề phần mềm."
Các phương pháp SRE có lợi đến mức chúng đã được các công ty lớn khác áp dụng và theo thời gian, được nâng cao và thêm vào, dẫn đến một lĩnh vực nghề nghiệp chia sẻ nhiều đặc điểm của DevOps ngày nay nhưng có một vài điểm khác biệt quan trọng. Trong khi cả hai đều tồn tại ở giữa quá trình phát triển và vận hành, SRE tập trung nhiều hơn vào tự động hóa. Thật vậy, Google đã từng mô tả mục đích của kỹ sư là "tự động hóa cách thoát khỏi công việc của họ".
Các tổ chức khác nhau làm SRE khác nhau và có thể gọi nó là Kỹ thuật sản xuất hoặc Kỹ thuật cơ sở hạ tầng thay thế. Dù nó được dán nhãn là gì, vào cuối ngày, công việc của một kỹ sư là trở thành một người làm việc theo nhóm làm việc liên tục để cải thiện độ tin cậy của trang web, sử dụng KPI quản lý sự cố (Chỉ số hiệu suất chính), viết mã, xây dựng dịch vụ và tự động hóa các quy trình thủ công. Vì các trang web hoạt động 24 giờ một ngày, các SRI thường làm việc trực để trả lời bất cứ khi nào họ cần.
- Làm việc với một bức tranh tổng quan toàn cảnh về các dự án
- Đóng vai trò là cầu nối quan trọng giữa các nhóm
- Cải thiện quy trình và giúp tăng lợi nhuận của tổ chức
- Bồi thường tài chính hào phóng
Lịch làm việc
SRE là một lĩnh vực nghề nghiệp được đền bù xứng đáng, vì vậy hãy mong đợi kiếm được những mức lương đó bằng cách bỏ ra những giờ làm việc toàn thời gian! Như ParkMyCloud giải thích, độ tin cậy của trang web về cơ bản tương đương với tính khả dụng của doanh nghiệp. Nói cách khác, tùy thuộc vào Kỹ sư độ tin cậy của trang web để giảm thiểu thời gian chết tốn kém. Điều đó có thể chuyển thành làm việc sau giờ làm việc hoặc trực để phản hồi nhanh chóng các vấn đề.
Nhiệm vụ tiêu biểu
- Tạo hoặc cải thiện phần mềm liên quan đến hoạt động và hỗ trợ
- Tối ưu hóa và tự động hóa các quy trình
- Đảm bảo thực hành tính nhất quán về kỹ thuật phát hành
- Giải quyết và giảm thiểu sự leo thang hỗ trợ
- Nắm bắt và ghi lại thông tin mới học để tham khảo sau này, chẳng hạn như bằng cách tạo runbook. Ngăn chặn "siloing" hoặc tích trữ kiến thức có thể chia sẻ
- Khắc phục sự cố
- Tiến hành đánh giá sự cố (còn được gọi là khám nghiệm tử thi, hồi cứu hoặc phân tích nguyên nhân gốc rễ) để xác định lý do tại sao một vấn đề xảy ra mà không đổ lỗi
Trách nhiệm bổ sung
- Làm việc theo yêu cầu để khắc phục sự cố và các sự cố ứng phó sự cố khác
- Đảm bảo tuân thủ các giao thức tổ chức
- Tạo danh sách mục hành động để giải quyết các vấn đề và giảm thiểu các vấn đề tương tự trong tương lai trong Vòng đời phát triển phần mềm
Soft Skills
- Khả năng tạo điều kiện cộng tác giữa các nhóm
- Phân tích giải quyết vấn đề
- Chú ý đến chi tiết
- Dịch vụ khách hàng
- Cảm
- Linh hoạt
- Tập trung vào mục tiêu
- Có tính tổ chức cao; Kỹ năng quản lý thời gian tốt
- Điều tra và tò mò
- Kỹ năng lãnh đạo và quản lý
- Tính khách quan
- Định hướng quy trình
- Tư duy đảm bảo chất lượng
- Kỹ năng giao tiếp mạnh mẽ
Kỹ năng kỹ thuật
SME được yêu cầu phải có một số bộ kỹ năng liên quan đến những điều sau:
- Xây dựng các công cụ tự động hóa
- Xây dựng ngôn ngữ cấu hình
- Trình biên dịch
- Cơ sở dữ liệu
- Thiết kế hệ thống phân tán
- Kiến thức miền liên quan đến quản trị hệ thống, phát triển, quản lý cấu hình, kiểm thử tích hợp
- Quản lý mã nguồn chung
- Cài đặt
- Mạng
- Hệ điều hành
- Trình quản lý gói
- An ninh
- Kỹ thuật phần mềm
- Cơ quan thiết kế hệ thống máy tính
- Tập đoàn/công ty
- Cơ quan chính phủ/quân đội
- Y tế
- Cơ sở giáo dục đại học
- Truyền thông và giải trí
Nếu một tổ chức có một trang web hoặc các trang web quan trọng đến mức họ cần một Kỹ sư độ tin cậy của trang web, thì kỳ vọng sẽ tăng cao. Theo Netguru, bốn lý do chính để thuê SRE là để giảm thiểu thời gian chết, dự đoán và giảm thiểu rủi ro, đạt được sự phát triển nhanh hơn và tiết kiệm tiền thông qua những quy trình đó và các quy trình được thực hiện khác. Rõ ràng là các Kỹ sư Độ tin cậy của Trang web đã sẵn sàng và trong khi họ đang cố gắng sắp xếp khối lượng công việc, họ cũng phải đi trước những thay đổi đối với thế giới CNTT.
Giờ có thể trở nên dài khi sự cố xảy ra, chưa kể đến tất cả các vòng quay... có nghĩa là ngay cả khi bạn đang tắt, về mặt kỹ thuật, bạn vẫn đang bật. Thời gian phản hồi sự cố có thể ngắn và mỗi nhà tuyển dụng đều khác nhau khi nói đến việc bồi thường cho công việc được thực hiện sau giờ làm việc. Một số có thể cấp Thời gian nghỉ có lương, một số có thể trả thêm tiền và một số có thể đưa ra lời cảm ơn nồng nhiệt "cảm ơn rất nhiều" và không có gì khác.
SRE vẫn là một khái niệm tương đối mới đối với nhiều tổ chức đang phát triển. Do đó, một xu hướng là các doanh nghiệp vẫn đang cố gắng tìm ra cách quản lý nó tốt nhất. Một yếu tố chính thúc đẩy Kỹ thuật độ tin cậy của trang web là giải quyết sự cố, cho thấy quan điểm rằng các công ty chỉ đơn giản là cảm thấy mệt mỏi với việc dập tắt đám cháy và muốn xử lý chúng tốt hơn.
Tất nhiên, điều này làm giảm căng thẳng từ ban quản lý bằng cách đặt căng thẳng thay vào đó lên các SME. Điều này, đến lượt nó, có thể đòi hỏi người sử dụng lao động phải tìm cách giữ cho những người lao động bị căng thẳng đó khỏe mạnh và khỏe mạnh, để lực lượng lao động có thể hoạt động với hiệu quả cao nhất. Một số công ty làm điều này tốt hơn những công ty khác, nhưng xu hướng là nhận ra giá trị của việc chăm sóc những người lao động bận rộn đang chăm sóc doanh nghiệp!
Cái tên "Kỹ sư độ tin cậy của trang web" cho chúng ta một vài manh mối về kiểu người làm việc trong lĩnh vực này. Họ thích làm việc trên các trang web, một mối quan tâm mà hầu hết các SRE đã phát triển khi còn trẻ. Họ chịu trách nhiệm đảm bảo các trang web là "đáng tin cậy", có nghĩa là mọi thứ hoạt động như thế nào khi cần thiết. Vì vậy, bản thân người lao động nên đáng tin cậy, đó là một đặc điểm khác thường được mài giũa trong những năm đầu của một người.
Những người như vậy thích đúng giờ và chuẩn bị và có khả năng học tập tốt. Thật vậy, để trở thành một kỹ sư thuộc bất kỳ loại hình nào thường đòi hỏi năng khiếu học thuật mạnh mẽ, đặc biệt là trong toán học và khoa học, tất nhiên. Tuy nhiên, một trong những điều thú vị về lĩnh vực này là có bao nhiêu kỹ năng mềm phát huy tác dụng.
SRE cần phải là người của mọi người, người cảm thấy thoải mái khi làm việc với các nhóm và có thể thúc đẩy sự cộng tác giữa các nhóm đó. Kết quả là, họ có thể đã giữ các vị trí lãnh đạo trong trường học, hoặc có lẽ đơn giản là có rất nhiều anh chị em để cạnh tranh! SME là những chuyên gia về hiệu quả, được đào tạo để tìm cách làm cho mọi thứ tốt hơn bằng cách nghiên cứu các vấn đề và xác định các giải pháp dựa trên nghiên cứu của họ. Điều này đòi hỏi một tư duy sáng tạo nhưng phân tích như thể cả hai bán cầu não đang hoạt động song song. Có thể nhiều SRO thuận cả hai tay hoặc giỏi chơi nhạc cụ.
- Kỹ sư độ tin cậy của trang web cần có bằng cử nhân, tốt nhất là về Khoa học Máy tính hoặc một lĩnh vực liên quan
- Không có một con đường nhất định để trở thành một SRE. Một số công nhân tham gia thông qua thực tập; những người khác có thể thực hiện bootcamp, sau đó phát triển các kỹ năng trong khi làm các công việc CNTT khác trong khi tự mình thực hành các kỹ năng khác
- Kinh nghiệm làm việc phong phú là yêu cầu chính của hầu hết các nhà tuyển dụng (nhiều nhân viên SRE lần đầu tiên làm việc trong DevOps, sysadmin hoặc với tư cách là nhà phát triển hoặc kỹ sư phần mềm)
- Các lớp học để làm quen với Java, Python, Ruby hoặc C ++, cũng như Linux, Kubernetes và MySQL
- Các khóa học xây dựng kỹ năng mềm tiếng Anh, viết, nói, làm việc nhóm và lãnh đạo
- Các chứng nhận tùy chọn bao gồm:
- Chứng nhận Kỹ sư Độ tin cậy của Hiệp hội Chất lượng Hoa Kỳ
- Chứng nhận Nền tảng SRE của Viện DevOps
- Chứng nhận Linux + của CompTIA
- Tự học bằng cách tham gia các khóa học về:
- edX - Giới thiệu về DevOps và Kỹ thuật độ tin cậy của trang web
- Lynda (từ LinkedIn) - DevOps Foundations: Kỹ thuật độ tin cậy của trang web
- Udemy - Giới thiệu về Kỹ thuật Độ tin cậy
- Coursera - Kỹ thuật độ tin cậy của trang web: Đo lường và quản lý độ tin cậy
- Lưu ý, khóa học tương tự cũng được cung cấp tại Pluralsight
- Phần lớn những gì bạn cần biết để trở thành một Kỹ sư độ tin cậy của trang web thành công sẽ được học bên ngoài chương trình đại học của bạn!
- Tốt nhất, hãy tìm các chương trình cung cấp các khóa học trong các lĩnh vực được liệt kê ở trên
- Đọc tiểu sử của giảng viên để xem các lĩnh vực chuyên môn và nền tảng của họ là gì
- Có những loại câu lạc bộ và tổ chức sinh viên nào? Nhiều kỹ năng mềm và kỹ thuật được học hiệu quả nhất thông qua các tương tác đồng nghiệp phong phú
- Đảm bảo trường được công nhận
- Tìm kiếm các chương trình công bố số liệu thống kê việc làm sau khi tốt nghiệp và có hồ sơ theo dõi vững chắc
- Cân nhắc những ưu và nhược điểm của việc đăng ký vào một chương trình trực tuyến. Sự tham gia trong khuôn viên trường rất có lợi cho việc xây dựng các kỹ năng mềm, vì vậy đôi khi một chương trình kết hợp có lợi
Các Chương trình Khoa học Máy tính Tốt nhất của US News & World Report có thể giúp bạn bắt đầu, nhưng đừng chỉ dựa vào một bảng xếp hạng. Bạn không muốn bỏ lỡ những cơ hội tốt, vì vậy chúng tôi khuyên bạn nên xem xét các danh sách như 50 trường cao đẳng khoa học và kỹ thuật máy tính giá cả phải chăng tuyệt vời của Great Value College cho năm 2020 hoặc 25 chương trình khoa học máy tính hàng đầu của trường có lợi tức đầu tư tốt nhất.
Đại học có thể trở nên đắt đỏ thái quá, nhưng hãy nhớ rằng nhiều nhà tuyển dụng rất thực tế. Họ có thể quan tâm đến các kỹ năng kỹ thuật cứng của bạn hơn là bạn tốt nghiệp trường nào. Nói cách khác, chỉ đơn giản là có bằng cấp từ một trường đại học tư thục tốn kém sẽ không đảm bảo một công việc trong lĩnh vực công việc này. Tập trung vào việc tham gia các lớp học cụ thể cần thiết để xây dựng kỹ năng và có được càng nhiều kinh nghiệm thực tế càng tốt.
- Như đã đề cập, không có con đường duy nhất để trở thành SRE, vì vậy hãy vạch ra một vài tùy chọn
- Xem tin tuyển dụng từ các công ty bạn muốn làm việc. Chú ý đến kinh nghiệm làm việc và học tập cần thiết, sau đó thiết kế ngược lại con đường sự nghiệp để đạt được điều đó
- Ở trường trung học, hãy xây dựng một nền tảng vững chắc bằng cách tham gia càng nhiều môn tự chọn CNTT càng tốt
- Thực hành càng nhiều kỹ năng thực hành càng tốt! Tham gia các khóa học liên quan đến các mục trong Giáo dục và Đào tạo của chúng tôi ở trên
- Đừng quên làm việc trên văn bản của bạn. Viết kỹ thuật rất quan trọng nhưng bạn cũng sẽ cần dịch các chủ đề phức tạp sang thuật ngữ của giáo dân
- SME cần có kỹ năng làm việc nhóm và lãnh đạo tốt. Đây thường là những đặc điểm bị bỏ quên mà bạn sẽ có sau này, vì vậy hãy tìm cách phát triển chúng sớm
- Không gì có thể đánh bại việc có một người cố vấn giàu kinh nghiệm, vì vậy hãy liên hệ với cựu sinh viên hoặc giảng viên để được tư vấn
- Dạy người khác. Giảng dạy tạo điều kiện cho trải nghiệm học tập mới cho cả hai bên
- Đọc và tham gia các cuộc thảo luận trên Quora, Reddit, Dev.to và các trang web khác
- Khi kỹ năng của bạn đủ tốt, hãy nhận một số kinh nghiệm trả phí trên Upwork
- Tìm thực tập trên Indeed, hoặc hỏi chương trình đại học của bạn xem họ có cơ hội không
- Hãy trở thành người dẫn đầu trong các câu lạc bộ liên quan đến CNTT và xây dựng một mạng lưới rộng lớn gồm các đồng nghiệp và cộng sự!
- Đưa ra lời nói! Phần lớn các công việc hiện được tìm thấy thông qua mạng
- Làm bài kiểm tra sàng lọc TripleByte DevOps. Nếu bạn vượt qua, bạn sẽ nhận được một cuộc phỏng vấn với các nhà tuyển dụng trong mạng lưới của họ.
- Tìm kiếm các vị trí tuyển dụng trên Indeed, Monster, USAJobs, ZipRecruiter, LinkedIn và Glassdoor
- Tìm hiểu những gì nhà tuyển dụng tìm kiếm! Usenix có thể tải xuống .pdf liệt kê các mẹo nội bộ về việc thuê SRO
- Một số nhà tuyển dụng đào tạo SRI của họ trong nội bộ, vì vậy bạn có thể muốn bắt đầu trong một công việc nhưng với kế hoạch làm việc theo cách của bạn trong công ty
- Nhận thực tập. Họ không phải lúc nào cũng được trả lương cao nhưng bạn sẽ đặt chân vào cửa và họ có thể dẫn đến công việc toàn thời gian
- Ban giám khảo đã tìm hiểu xem các hội chợ việc làm hữu ích như thế nào, nhưng các hội chợ dành riêng cho ngành chắc chắn có thể giúp bạn tiếp xúc với những cơ hội tồn tại và tạo cơ hội trò chuyện với người lao động
- Có sơ yếu lý lịch của bạn theo thứ tự. Job Hero có một số mẫu sơ yếu lý lịch Kỹ sư độ tin cậy của trang web tuyệt vời để đánh cắp ý tưởng từ
- Mời một người viết sơ yếu lý lịch chuyên nghiệp (hoặc biên tập viên) để nâng cao tài liệu của bạn và làm cho nó tốt nhất có thể. Nhưng hãy nhớ rằng, hãy điều chỉnh từng sơ yếu lý lịch cho phù hợp với công việc cụ thể mà bạn đang ứng tuyển
- Nghiên cứu cơ sở dữ liệu khổng lồ về tài nguyên và câu hỏi phỏng vấn của GitHub!
- Rất nhiều phụ thuộc vào quy mô của tổ chức. Một số công ty quảng bá từ bên trong; những người khác có thể muốn các ứng cử viên bên ngoài. Nên có các cuộc thảo luận về cơ hội thăng tiến với người giám sát của bạn ngay từ đầu
- Hãy chủ động. Rèn luyện bản thân, tham gia các khóa học, tiếp tục học hỏi. Khi có một xu hướng mới trong công nghệ, hãy tìm hiểu mọi thứ bạn có thể về nó và trở thành một chuyên gia về chủ đề
- Thể hiện lòng trung thành với công ty của bạn và trở thành một tài sản đáng tin cậy, vô giá xứng đáng với trách nhiệm gia tăng. Cư xử theo cách cho thấy bạn đã sẵn sàng thăng tiến
- Luôn ghi nhớ các kỹ năng mềm. Ngay cả những nhân viên có kỹ năng kỹ thuật cao nhất cũng sẽ gặp khó khăn trong việc thăng tiến nếu họ không hòa hợp với những người khác
- Hãy là một ông chủ. Thể hiện năng lực và tiềm năng lãnh đạo của bạn. SRE phải có khả năng hướng người khác theo cách hợp tác nhưng quyết đoán (và khi cần, chắc chắn)
- Chứng minh bạn đáng tin cậy. Hãy đúng giờ và nếu bạn đang trực phản hồi sự cố một cách nhanh chóng, hãy thực hiện công việc một cách siêng năng và tìm cách giảm thiểu các vấn đề tương tự trong tương lai
Các trang web
- Bash-Scripting nâng cao
- Python tuyệt vời
- Hướng dẫn lập trình mạng của Beej
- Thử thách chỉ huy
- Cyber Aces
- DevOps BootCamp
- DevOpsNgày
- Eli anh chàng máy tính
- Git
- Git ngâm
- Giới thiệu về SQL: Truy vấn và quản lý dữ liệu
- Katacoda
- Kỹ thuật hệ điều hành của MIT
- Đại học MongoDB
- Trường Ops
- Qua dây
- Học múa rối
- SQLZOO
- SREcon
- SRE hàng tuần
- Diễn viên Sysadmin
- Bài đăng trên blog lớn về tài liệu đào tạo an toàn thông tin
- Công cụ Geek
- Sách Google SRE
- Hướng dẫn mở về Amazon Web Services
- Sơn lót thiết kế hệ thống
- The Unix Workbench
- Hộp công cụ Unix
Sách vở
- Xây dựng hệ thống an toàn và đáng tin cậy: Các phương pháp hay nhất để thiết kế, triển khai và bảo trì hệ thống, bởi Heather Adkins, Betsy Beyer, et al.
- Hệ điều hành: Three Easy Pieces, bởi Remzi Arpaci-Dusseau và Andrea Arpaci-Dusseau
- Kỹ thuật độ tin cậy của trang web thực tế, bởi Pethuru Raj Chelliah, Shreyash Naithani, et al.
- Kỹ thuật độ tin cậy của trang web: Cách Google chạy hệ thống sản xuất, bởi Niall Richard Murphy, et. Al.
- Dự án Phoenix: Tiểu thuyết về CNTT, DevOps và Giúp doanh nghiệp của bạn giành chiến thắng, của Gene Kim, Kevin Behr, et al.
Kỹ thuật độ tin cậy của trang web có thể là một lĩnh vực nghề nghiệp ly kỳ với rất nhiều trách nhiệm. Tuy nhiên, con đường đột nhập không phải lúc nào cũng khô ráo. Nhiều người bắt đầu ở các khu vực khác, và đôi khi họ kết thúc ở lại những khu vực đó. Một số lựa chọn công việc "Kế hoạch B" bao gồm::
- Lập trình viên Back-End
- Quản lý hệ thống máy tính và thông tin
- Lập trình viên máy tính
- Chuyên gia hỗ trợ máy tính
- Nhà phân tích hệ thống máy tính
- Quản trị viên cơ sở dữ liệu
- DevOps
- Lập trình viên Front-End
- Lập trình viên Full-Stack
- Chuyên viên Phân tích An toàn Thông tin