본문 바로가기

문제 해결 모음5

[k8s] Prometheus Error scraping target 해결하기 (connect: connection refused) (controller-manager, etcd, proxy, scheduler) 🔹 구성 환경Master Node: 3대Worker Node: 10대kube-prometheus-stack 버전: 67.5.0🔹 사전 지식Static Pod란?kubelet이 직접 관리하는 Pod로 일반적인 Pod와 다르게 API 서버와 상관없이 동작한다. Kubernetes API 서버에 의해 스케줄링되지 않고, 각 노드의 Kubelet이 로컬 설정 파일(/etc/kubernetes/manifests/)을 기반으로 실행한다.kube-apiserver.yamlkube-controller-manager.yamlkube-scheduler.yamletcd.yaml /etc/kubernetes/manifests/ 하위 yaml을 수정하면 즉시 적용된다.  yaml을 수정하니 Pod가 terminated되고 .. 2025. 2. 13.
[nginx] Jupyter Notebook 코드 실행 안됨(nginx socket error)(with kubeflow) 🔹 구성 환경사용자 ➡ Nginx ➡ Kubernetes(Ingress, Ingress Nginx Controller, Kubeflow, Jupyter Notebook)사용자는 Nginx를 거쳐서 Jupyter Notebook에 접근한다.🔹 문제 상황Kubeflow를 통해서 Jupyter Notebook Pod를 생성했다.Chrome에서 Jupyther Nodebook에 접근해서 Python 코드를 작성했고, 코드 실행 버튼을 클릭했는데 코드가 실행되지 않고 그냥 skip되는 느낌으로 다음으로 넘어갔다.즉, 코드가 실행이 안된다. 웹브라우저 개발자 도구에서 에러를 클릭해보니아래와 같이 WebSocket 에러가 나고 있었다.WebSocket connection to 'ws://{IP}/notebook/.. 2025. 1. 14.
[nginx] PID 에러 (Failed to parse PID from file /run/nginx.pid: Invalid argument, Can't open PID file /var/run/nginx.pid) 🔹 로그 내용Nginx 상태 확인 시 다음과 같은 PID 관련 로그 발생systemctl status nginxnginx.service: Failed to parse PID from file /run/nginx.pid: Invalid argument또는nginx.service: Can't open PID file /var/run/nginx.pid (yet?) after start: No such file or directory🔹 문제 원인Nginx가 시작될 때, PID를 /run/nginx.pid 파일에 기록하는데, 이 파일이 생성되기 전에 systemd가 이를 읽으려고 시도하면 위와 같은 오류가 발생할 수 있다.🔹 문제 해결Nginx가 시작된 후 0.1초 동안 대기하여 PID 파일이 생성될 수 있.. 2025. 1. 14.
[k8s] nodeSelector 에러(node(s) didn't match Pod's node afficity/selector) 🔹 에러 내용Warning FailedScheduling 3m33s default-scheduler 0/10 nodes are available: 10 node(s) didn't match Pod's node afficity/selector.preemption: 0/10 nodes are available: 10 preemption is not helpful for scheduling. 🔹 문제 원인Deployment에 nodeSelector를 설정했는데 오타 발생.nodeSelector와 일치하는 Label을 가진 Node가 하나도 없음.Pod를 배포할 수 있는 노드가 하나도 없어서 에러 발생.🔹 문제 해결Node Label이랑 nodeSelector랑 일치하는지 검토한 후 올바르게 수정.Node.. 2025. 1. 14.
폐쇄망 yum repo 에러 (Errors during downloading metadata for repository, Failed to download metadata for repo) 🔹 구성 환경네트워크: 폐쇄망OS: RHEL 8🔹 에러 내용systemd[1]: Starting dnf makecache...dnf[887900]: Updating Subscription Management repositories.dnf[887900]: Unable to read consumer identitydnf[887900]: This system is not registered with an entitlement server. You can use subscription-manager to register.dnf[887900]: Red Hat Enterprise Linux 8 for x86_64 - AppStre 0.0 B/s | 0 B 00:00dnf[887900]: Errors.. 2025. 1. 14.
반응형