일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- wordcloud
- 파이썬
- SGD
- 프로그래머스
- codingtest
- 협업 필터링
- 웹스크래핑
- coursera
- Python
- 코딩테스트
- 머신러닝
- 코테
- pytorch
- 딥러닝
- 알고리즘
- Tensor
- Overfitting
- 백준
- TF-IDF
- 데이터
- selenium
- 부스트캠프
- recommendation system
- 분산 시스템
- 데이터 엔지니어링
- 웹크롤링
- 시각화
- Cosine-similarity
- 추천시스템
- 추천 시스템
- Today
- Total
목록전체 글 (138)
개발자식

리뷰전 CosyVoice 개발 이야기지금 회사에서 학습하고 있는 TTS 모델(CosyVoice2) 이전에 나온 버전으로 품질이 매우 좋고, 다양한 테스크로 활용할 수 있어서 이것저것 실험해 보고 있다. CosyVoice1도 학습해 봤었는데, 품질이 매우 좋고 화자 유사도가 굉장히 높았다. 그래서 기존 TTS 모델보다 억양이나 발음이 자연스럽고 화자 특성이 살아 있어서 지금 교체 과정에 있다. 알리바바에서 개발한 모델로 학습, 추론, 배포 코드를 모두 github에 제공하고 있으며 코드 구현도 굉장히 깔끔하게 되어있다. 며칠 전까지도 코드 업데이트가 되고 있어서 계속 팔로우 하면서 해보고 있다. 원래 CosyVocie가 LLM에서 추론 속도가 굉장히 오래 걸리는 편이였는데, Dev 브랜치에 vllm이 적용..
✔︎ 문제 https://school.programmers.co.kr/learn/courses/30/lessons/132202 프로그래머스 코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요. programmers.co.kr ✏️ 나의 풀이 - SELECT문에 Alias에 따옴표를 붙이고 ORDER BY에서도 붙였었는데, ORDER BY에서는 지정한 Alias 그대로 작성해야 적용된다. 즉 SELECT에서 따옴표를 썼더라도 ORDER BY에서는 따옴표 빼야한다. - 헷갈린다면 SELECT COLUMN 순서대로 ORDER BY 2, 1 이렇게 써줘도 된다. 아니면 Alias 말고 COUNT(MCDP_CD),..
✔︎ 문제: https://www.acmicpc.net/problem/14503 14503번: 로봇 청소기 첫째 줄에 방의 크기 $N$과 $M$이 입력된다. $(3 \le N, M \le 50)$ 둘째 줄에 처음에 로봇 청소기가 있는 칸의 좌표 $(r, c)$와 처음에 로봇 청소기가 바라보는 방향 $d$가 입력된다. $d$가 $0$인 경우 북쪽 www.acmicpc.net ✏️ 나의 풀이 - 이 문제는 직접 그려서 이동했을 때, 예제와 같은 값이 나오지 않아 문제를 여러번 읽었었다..! 일단 1번으로 돌아간다는 말은 전체 1번을 의미한다. - 문제 그대로를 구현하면 되는데, 1. 현재 칸의 청소 유무와 벽인지 아닌지 구분이 필요하고 2. 주변이 청소되어 있는지 확인한다. 3. 주변이 모두 청소가 되어있다..
✔︎문제: https://school.programmers.co.kr/learn/courses/30/lessons/131112 프로그래머스 코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요. programmers.co.kr ✏️ 나의 풀이 - 강원도로 시작하는 주소의 행만 포함시켜야 한다. - '강원도%'로 뒷자리가 몇자리고 무엇이든지 상관없이 앞에 강원도가 포함되어 있으면 된다. - '%강원도%'면 어쩌고 강원도여도 되고, 강원도 어쩌고여도 되고, 어쩌고 강원도 어쩌고여도 된다. - 그렇면 글자수를 제한하면서 문자열 포함여부를 조건으로 걸려면? -> '____강원도__': 라고 하면 _개수만큼 문자가 ..
✔︎문제: https://www.acmicpc.net/problem/10799 10799번: 쇠막대기 여러 개의 쇠막대기를 레이저로 절단하려고 한다. 효율적인 작업을 위해서 쇠막대기를 아래에서 위로 겹쳐 놓고, 레이저를 위에서 수직으로 발사하여 쇠막대기들을 자른다. 쇠막대기와 레이저 www.acmicpc.net ✏️ 나의 풀이 - ()인 레이저인 경우와, 막대기인 경우 두가지로 나뉘는데 레이저인 경우 지금까지 쌓여있는 막대기를 수직으로 자른다. ex) (()) : 막대기 한개 레이저 한개로 두동강 남 -> 답: 2 - 막대기인 경우 stick 리스트에 쌓아주고, 레이저인 경우 stick에 쌓인 막대기개수 더해준다. 그리고 막대기가 끝나는 지점이라면 리스트에서 빼주고 +1 한다. - 현재와 앞에 값을 비교..
✔︎ 문제: https://www.acmicpc.net/problem/1439 1439번: 뒤집기 다솜이는 0과 1로만 이루어진 문자열 S를 가지고 있다. 다솜이는 이 문자열 S에 있는 모든 숫자를 전부 같게 만들려고 한다. 다솜이가 할 수 있는 행동은 S에서 연속된 하나 이상의 숫자를 잡고 모 www.acmicpc.net ✏️ 나의 풀이 0과 1의 연속적인 구간을 덩어리로 묶었을 때, 더 작은 덩어리 개수인 것을 출력하는 아이디어로 구현 - 문자열에서 숫자가 바뀌는 구간을 딕셔너리에 저장하고, 0과 1 둘중에 더 작은 값을 출력한다. - 0에서 1로 바뀔 때 check[0] += 1, 1에서 0으로 바뀔 때 check[1] += 1 로 값을 더해준다. ex) 000110 일 때, 1) 0 -> chec..
📃 문제: https://school.programmers.co.kr/learn/courses/30/lessons/42885 프로그래머스 코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요. programmers.co.kr ✏️ 나의 풀이 - 순차적으로 탐색해서 조건에 맞는지 확인한다면, 다음과 같은 반례가 있음 [50, 50, 30, 20, 70, 80], limit = 100 -> 50+50, 30+20, 70, 80 으로 4개의 구명보트가 필요하지만, 20+80, 30+70, 50+50으로 태우면 3개의 구명보트만 필요하다. - 그래서 가장 몸무게가 많이 나가는 사람과 적게 나가는 사람을 쌍을 이뤄 ..
문제: https://school.programmers.co.kr/learn/courses/30/lessons/133024 프로그래머스 코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요. programmers.co.kr 고민 포인트 - TOTAL_ORDER 기준으로 내림차순 정렬, 같다면 SHIPMENT_ID 오름차순 정렬 -> ORDER BY절 뒤에 우선순위가 있는 열을 순서대로 적는다. DESC: 내림차순, ASC: 오름차순(default) 정답 코드 SELECT FLAVOR FROM FIRST_HALF GROUP BY FLAVOR ORDER BY SUM(TOTAL_ORDER) DESC, SHIPME..
문제: https://school.programmers.co.kr/learn/courses/30/lessons/131535 프로그래머스 코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요. programmers.co.kr 고민 포인트! TINYINT란? JOINED 컬럼에서 년도만 조건으로 계산하기 TINYINT - int에 들어가는 데이터 타입으로 가장 작은 크기의 데이터 타입 크기 : 0 ~ 255 비고 : 0을 시작으로 2^8(=2의8승=256)번째까지 정수 용량 : 1바이트 날짜 데이터에서 연도, 달, 날짜 추출하기 MYSQL에서 다음과 같은 함수로 날짜 데이터의 일부를 추출할 수 있다. YEAR ..

머신러닝의 가장 큰 목적은 실제 데이터를 바탕으로 모델을 생성해서 다른 입력 값을 넣었을 때 발생할 아웃풋을 예측하는 데 있다. 이때 찾아낼 수 있는 가장 직관적이고 간단한 모델은 선이다. 이러한 선을 찾고 분석하는 방법을 선형 회귀 분석이라고 부른다. 선형 회귀 (Linear Regression) : 종속 변수 y와 한 개 이상의 독립 변수 (=설명 변수) x 사이의 선형 상관 관계를 모델링하는 회귀분석 기법 - 정답이 있는 데이터의 추세를 잘 설명하는 선형 함수를 찾아 x에 대한 y를 예측 ex) 키가 클수록 몸무게가 무겁다, 집의 평수가 클수록 집의 매매 가격은 비싸다 단순 회귀분석 (Simple Regression Analysis) : 1개의 독립변수 x가 1개의 종속변수 y에 영향을 미칠 때 -..