보호되어 있는 글입니다. 내용을 보시려면 비밀번호를 해주세요.
보호되어 있는 글입니다. 내용을 보시려면 비밀번호를 해주세요.
2024년 회고록을 끝내지 못한(않....은...…) 채 2025년마저 지나가버렸다. cf) 안녕- 2024, 안녕? 2025 지못미(연륜 드러내기) 돌이켜보면 그만큼 2025년은 나에게 숨을 고를 틈 없을 정도로 변화가 많았던 한 해였다. 그리고 2026년의 문턱에 들어선 지금, 불과 지난 한 달 사이에도 정말 많은 일이 있었다. 회사에는 큰 변화가 찾아왔고, 그 변화로 인해서 회사는 AI라는 흐름을 더 이상 ‘관찰’이 아니라 ‘탑승’의 대상으로 받아들이게 되었다. 그 과정에서 개인적으로도 많은 고민과 생각이 쌓였고, 올해가 나에게 있어 꽤나 큰 전향점이 될 것 같아 늦었지만 지난 해 회고와 새해 다짐을 정리해본다.2025 개인 생활 회고 2025년 내 생활에 있어서 큰 변화 중 하나는 운동이라는..
0. 상황 - 최근 Ubuntu 서버에 새로 배포한 supervisor로 실행 중인 서비스가, 그 어떤 CPU나 memory, network 리소스 이상 사용량 추이도 없이 + 로그도 남기지 않고 죽어있는(숨 쉬어..!) 상황이 발생했다. - 사실 배포 초반에도 2회 정도 동일한 이슈가 있었지만, 그 당시에는 외부의 요인들이 너무 많아 자세하게 디버깅은 하지 않고, 헬스체크를 추가해 두는 정도로 조치를 해둔 뒤 다른 급한 일들을 쳐내고 있었다. 한동안 동일한 상황이 발생하지 않아 외부적 요인이었나 생각하던 와중 또다시 해당 서비스가 소리소문 없이(는 소리는 냈지만 모니터링 알림이 너무 많아 눈치를 채지 못했습니다! 이 일에 대한 개선은 나중에 여기서 또 포스팅해 봐야지!) 죽는 일이 발..
0. 상황 - Power Outage 발생 및 iDRAC 세팅 진행 시 몇 개의 서버 즉, 몇 개의 Proxmox cluster의 node 가 down 되며 전체 클러스터의 VM 시작이 불가. - 더 상세하게는 전원 복구 이후 서버가 재시작되며 자동시작이 설정되어있던 vm들은 시작되었지만, 순서 보장 등을 위해 자동시작을 설정하지 않았던 VM들을 시작하는 것이 불가능해졌음.1. 에러코드 전문Proxmox Cluster not ready - no quorum?2. 원인 - Proxmox 클러스터에서 작업을 수행하기위해 분산트랜잭션이 획득해야 하는 최소 투표수가 보장되지 않았기 때문에 발생한 상황.3. 해결방안 - Ref: https://pve.proxmox.com/pve-doc..
오늘은 2024년 마지막 날!간만에 `회고` 를 진행해볼까 한다. 개발자로 전향하고 현업에 뛰어들고나서는 처음으로 회고를 작성하는것 같은..데?(맞음)개인적으로도 연간 회고는 처음인데다, 본의 아니게 개발자로써의 첫 연간 회고글이라는걸 방금 깨달아버렸다. 생각보다 거창한 일이 되버렸는걸? 막연하게 느껴지는 점이 2025년이 내게는 참으로 중요한 한 해가 될 것 같아 지금이 내가 가고있는 방향이 맞는지 검토가 필요한것 같아, 이참에 개발로 전향하고나서의 모든 기간에 대해 돌아보는 시간을 가져보고자 한다. 2022-2023 개발자(지망생)으로써의 우당탕탕 김야나처음 개발이라는 분야로의 커리어 전환을 제안하고 또 도움을 많이 준 승진이, 무언가를 만들어내는 습관과 함께 공부해나갈 친우들을 만들어준 국비교육,..
0. 상황 - Docker compose로 java 어플리케이션을 3개 올려놓은 내 ec2 인스턴스는, docker compose를 up 한 뒤 24시간 이내로 CPU가 튀면서 인스턴스 상태검사에 실패하고, 배포 사이트 접속은 물론 ssh 접속마저 불가능해지는 이슈가 있었다. - 모니터링을 확인해보니, compose up을 실행한 후 하루가 되지 않아 실제로 cpu 사용율과 cpu크레딧 사용량이 튀면서 더이상 네트워크 패킷이 정상적으로 오가지 않는 것을 확인할 수 있었다.1. 에러코드 전문 - 일단...로그를 뺄 수 있을까? 시도해 보자2. 원인 - Amazon ec2는 아래 세 가지 상태 확인을 통해 각 ec2 인스턴스 상태를 모니터링한다. 1. 시스템 상태 확인 ..
0. 상황 - 이전 글 에서 말했듯이 aws의 t4g.micro(기존 : t3.micro)라는 작고 가녀린 ec2인스턴스에 docker compose로 spring 어플리케이션을 3개 + nginx까지 구동시키다가, oom kill java 이슈가 발생했다..(해당 상황을 참여중인 커뮤니티에 공유하니, 모두들 이구동성으로 t3.micro, t4g.micro에 사과하라고 하셨다😅😅)1. 에러코드 전문 - ec2 인스턴스의 System log에서 발견한 oom 관련 로그는 아래와 같았다.[69465.875991] systemd invoked oom-killer: gfp_mask=0x140cca(GFP_HIGHUSER_MOVABLE|__GFP_COMP), order=0, oom_score_adj..
드디어 야나 난생 처음으로 AWS 써밋 댕겨왔습니다여이이이-!!! 개발로 넘어오기 전 근무했던 사무실이, 코엑스 바로 옆이었어서 감회가 더 색달랐다..! 첫 세션은 컨테이너..! EMR on EKS..!사실 아직 컨테이너 기술과 데이터 처리 분야에 대해서는 배경지식이 거의 없었기에 온전히 이해할 수는 없었지만(물론 설명을 정말 쉽게 해주신 덕분에 대략적인 감은 잡을 수 있었다!), 데이터 사용을 원하는 개발자들이 다른것이 아닌 "개발"에만 집중 할 수 있도록 플랫폼을 생성하고 개선해왔다는 부분이 인상적이었다.Apach Yunikorn, Airflow 관련해서도 이야기를 많이 해주셨는데, Yunikorn에서는 고급 스케줄링으로 자원경합을 방지하고 과도한 프로비저닝을 막았다는 부분의 원리가 궁금했고, A..
해당 게시글은 (케인)멘토님께 멘토링 세션을 통해 주고받은 질의응답의 내용을 정리한 글 입니다.😲 Q1. 운영환경이 아닌 개발환경에서 임시로 디버깅을 하기 위해서는 System.out을 사용해도 괜찮을까요?Java 강의 수강 도중 console에 출력하는 System.out(이하 sout)에 대해서 다루었습니다. sout 관련해서 기존부터 받아왔던 “Sout은 성능면에서나 로그를 남기는 이유와 관련해서나, Sout 사용을 지양하고 logger또는 logger 프레임워크를 사용하는것이 좋습니다” 라는 피드백이 생각나, “왜 개발 및 운영환경에서 Sout의 사용을 지양해야하는지” 이번 기회에 공부해보았습니다…관련해서 생긴 궁금증으로는 “운영환경이 아닌 개발환경에서 임시로 디버깅을 하기 위해서는 Syste..
해당 게시글은 (케인)멘토님께 멘토링 세션을 통해 주고받은 질의응답의 내용을 정리한 글 입니다.😲 Q1. NoSQL에서 no의 해석에서는 의견이 갈린다고 들었습니다. 멘토님께서는 NoSQL에서 no를 어떻게 해석하시나요?- no- not only- non-relational operational- non-relational database 👨🎓 A1. no는 not only의 NO라고 봅니다.SQL이 DB에서 우선순위가 높은 선택지였을때 나온것이 noSQL이라 불리우는 범주의 DB였기 때문입니다.즉, RDB만으로는 해결하기 어려운 문제가 점차 가속되던 상태에서 나온것이 noSQL입니다.(데이터가 늘어나는데 RDB에서는 그를 따라갈만한 RDB 퍼포먼스가 잘 나오지 않았고, DB가 못견뎌서 램을..
해당 게시글은 (케인)멘토님께 멘토링 세션을 통해 주고받은 질의응답의 내용을 정리한 글 입니다.😲 Q1. 멘토님께서는 service DTO controller DTO의 분리시기가 언제라고 보시나요? spring boot 어플리케이션에서 dto를 사용 할 때 어플리케이션 개발 초기에는 컨트롤러와 서비스 레이어 각각 나눠서 두기에는 두 dto간 요소 차이가 없을것이고 결국에는 코드의 중복으로 이어지기에, 대부분의 개발 초반에는 하나의 dto로 개발을 진행한 뒤, 프로젝트 규모가 커지면 추후에 분리하는편이라고 들었습니다. 저 또한 토이프로젝트 팀원들과 dto의 레이어별 분리 관련해서 논의를 진행중에 있습니다. 멘토님께서는 두 레이어에서 dto를 분리해야하는 시기는 언제쯤이라고 보실까요…! 👨🎓 A1...