Background
직무설명
Why Cloud
- 메인프레임 : 안정성 높지만 가격이 너무 높다.
- 유닉스 : 벤더 종속성이 높다. 벤더마다 CPU가 다르기에. Lock-in된다.
- 리눅스 : 인텔이 CPU 정복 오픈소스이지만 상용화 레드헷 -> 공짜가 아니다. 물리서버는 무지 비싸다.
- 클라우드 : 아마존이 블랙프라이데이 서버 증설 -> 증설한 서버가 놀고 있는 것을 보고만 있을 수 없어서 서버 호스팅을 해서 사업화하겠다. 사용한 만큼만 지불.
Why Kuberntetes
- 새로운 설정, 시스템 가이드대로 했는데도 뻑이 난다.
- 물리 서버 하나에 여러 논리 서버로 설치 분할해서 효율적으로 사용하자 -> VM
- 서비스 잘 되어서 확장하려는데 VM 환경 설치 또 해야
- 컨테이너 등장 -> VM OS, 웹하스 등을 도커 파일로 말아 -> 앞으로 컨테이너만 띄우면 된다.
- 쿠버네티스 -> 컨테이너 배포, 운영 관리 자동화
클라우드 시스템 운영자는 무슨 일?
프로세스 준수화
- ITSM -> IT service manamgement
- SLA 준수 -> Service level agreement
- 예) 99.99% 가용성 보장, 1달 장애 1회 미만 지표 준수 의무
- 고객 요청 -> 작업 요청서 작성 -> 유관 부서 승인 -> 작업 수행
- 품질검증팀에서 검수하므로 이 프로세스 타야 한다.
어떤 작업을 하나요?
- 구성관리 - 자원 구성 관리, 서버 증설, 교체
- 변경관리
- 장애관리 - SOP 문서 -> 장애 대응 문서
- 보안관리 - SQL Injection 대응, Ssh 커맨드 막기, ips, 디도스..
- 모니터링 관리
- OP -> 데이터 센터에 큰 화면에 메모리 80% 치면 삐용삐용
- 백업/복구 관리
- 백업은 필수. 고객사 서비스에 따라 장애등급이 나뉜다.
고객사가 무엇?
- 대기업 SI의 패밀리사, 협력사 전산시스템 구축, 운영
구체적인 업무
모닝 점검
- 매일 시스템 점검
- 대기업은 오픈소스 기반 솔루션 만들어 팀끼리 팔아 먹기도
정기 점검
- 서버 정기적 재부팅해야
- 정기 업데이트
- 보안테스트
- 장애대응 모의훈련
기타
- 고객사 가이드 만들기
- CSR 프로세스 태워서 요구사항 반영
- 업무 효율 자동화
- 검수망에서 테스트해서 체크 -> 상용망에 적용
- 검수망은 업무 외 시간에 꺼놓는다 -> 람다
- 커맨드도 조심히 쳐야 한다.
클라우드 운영자 장점
- 워라벨 -> 안정적인 시스템이라면 힘든 업무 X
- 신기술 -> 쿠버네티스 등
- 다양한 업무 지식 습득 -> OS, 네트워크 등 두루 알아야
- IP 차단해서 접속이 안 된다. -> 쁘띠 지웠다 깔았다?
단점
- 야간작업 -> 트래픽이 가장 적은 새벽 2시 새벽 4시에
- 반복업무 -> 장애가 없다면 평이한 업무의 연속
- 잘해야 본전 -> 기존에 있는 것 이관받아 운영하므로 잘 운영하면 본전
클라우드 운영자 역량?
- 배움추구 -> 신기술 끊임없이 학습
- 꼼꼼함 -> 휴먼 에러 사원 3년차, 대리 1~2년차에 발생-> 운영망에서 rm을 친다? -> 대형참사-> 수프쁘띠를 써도 탭이 뜬다-> 똑같은 작업 반복하므로 동시 명령어 -> 어쩌다 상용망 것이 꼈다 -> 나는 아니겠지?
- 소통능력 -> 장애발생 시 혼자 해결 노노 주변에 전파, 상황 공유
- 지방 데이터센터 - 일주일 있다가 방확벽이 열리는 사례
- 고객이 해달라고 바로 작업 태웠다 -> 덤탱이 쓴다
Q&A
자격증 취업 시 가산점?
대기업 인프라/클라우드 직무의 업무
- 인프라 운영 CSR(Customer Service Request)
- CSP
Link