본문 바로가기

전체 글71

NLP 01 - 환경 세팅 01. NLP 처리란? Natural Language (자연어) : 일상 생활에서 사용하는 언어 Natural Language Processing (자연어 처리) : 일상 생활 언어를 컴퓨터가 처리할 수 있도록 하는 가공 작업 NLP 예시 ... 음성 인식, 번역, 감성 분석, 텍스트 분류, 챗봇 NLP 모델 ... 뒷 파트에서 서술 01-01. 아나콘다/코랩 환경 세팅 파이썬 배포판 아나콘다 설치 진행 ... 아래 페이지에서 적당한 버전으로 설치 https://repo.anaconda.com/archive/ 아나콘다 프롬프트 실행 및 파이썬 패키지 최신 버전 업데이트 > conda update -n base conda ... done > conda update --all ... Retrieving no.. 2023. 4. 30. 20:48
SQL Server - SET 옵션 SQL Server SET 자주쓰는 옵션 정리 ① SET ANSI_NULLS SET ANSI_NULLS ON : NULL = NULL 비교 시 값 반환 불가 ([컬럼명] IS NULL) SET ANSI_NULLS OFF : NULL = NULL 비교 시 TRUE값 반환 ([컬럼명] = NULL) ② SET QUOTED_IDENTIFIER SET QUOTED_IDENTIFIER ON : 큰따옴표(" ")는 개체 이름으로, 작은따옴표(' ')는 문자열로 사용 SET QUOTED_IDENTIFIER OFF : 큰따옴표 (" ") 및 작은따옴표(' ')를 모두 문자열로만 사용 ③ SET NOCOUNT SET NOCOUNT ON : 영향을 받은 행 수 메시지를 리턴값으로 받지 않음 SET NOCOUNT OFF :.. 2023. 4. 8. 12:09
[tpj01] 01 - 데이터 수집 지난주에는 토이 프로젝트 설계와 작업 프로세스를 간단하게 정리했었다. 가장 까다롭다고 생각되는 작업이 2가지가 있는데 첫번째는 데이터 수집 (정확히는 '적절한' 데이터 수집) 두번째는 웹페이지 개발이다. 구글링 하다보면 데이터는 정말 많지만 쓰기 어려운 데이터가 많다. (적절한 파일 형식으로 제공되지 않는 데이터, 출처가 불분명한 데이터 등...) 그치만! 열심히 검색한 결과 아래 두 곳에서 쓸만한 자료를 수집했다. 1) 나이스 교육정보 개방포털 2) 서울 열린데이터광장 추가로 사용하고 싶은 데이터를 발견했는데 ... 파일 형식으로 제공하지 않아서 크롤링을 사용해야할 것 같고 이건 시간이 많이 필요할 듯 하다 .... 우선은 csv 파일로 최초 1회 데이터를 다운받았고, 이후 데이터 업데이트가 필요할 때.. 2023. 3. 12. 18:19
[tpj01] 01 - Toy Project 설계 어떤 기술에 대한 실력을 빠르게 향상시키기 위한 방법 중에는 실전에 바로 투입하는 방법이 있다. 나는 지금 무엇보다도 레벨업이 필요하기 때문에 간단한 토이 프로젝트를 개발해보면서 전반적인 흐름을 스터디해보고자 한다. 사용 기술/환경을 정리하다보니 내가 웹개발쪽에 한없이 약하다는 걸 깨달았다. 당연한 일이다. 내 담당이 아니니깐 ㅎ.. 어떤 주제를 다루면 좋을까 고민하다가 최근에 내가 특정 정보를 찾기 위해 열심히 구글링 했던 경험을 되돌아보니 쉽게 결정할 수 있었다. 주제에 대해서는 어느정도 개발에 들어간 다음에 오픈하도록 하겠다.. (부끄러움) 개발 기간은 3개월로 잡고있지만 그것 보다 빨리 끝내는게 목표이다. 그럼, 화이팅 해보도록 하자! ☺️ 2023. 3. 4. 15:48
DB 엔진 순위 2023년 2월 기준 1위 : Oracle 2위 : MySQL 3위 : SQL Server 4위 : PostgreSQL 5위 : MS Access 참고 : https://db-engines.com/en/ranking_trend 2023. 2. 27. 22:35
SQL Server - 동일 순위 처리 동일 순위 처리하기 요구사항 : TOP N 추출 시 순위가 동일한 값들을 모두 포함하고 싶은 경우 해결방안 : WITH TIES 구문 사용 -- 주문 정보를 저장하는 Order 테이블 생성 CREATE TABLE OrderTable ( OrderID INT PRIMARY KEY, CustomerID INT, OrderDate DATE ); -- 고객 정보를 저장하는 Customer 테이블 생성 CREATE TABLE Customer ( CustomerID INT PRIMARY KEY, CustomerName NVARCHAR(50) ); -- 데이터 삽입 INSERT INTO Customer (CustomerID, CustomerName) VALUES (1, 'CustomerA'); INSERT INTO .. 2023. 2. 24. 20:43
Kafka 01 - 정의 및 특징 정의 오픈소스 분산 메시지 스트리밍 플랫폼 Pub/Sub 모델을 지향하는 형태 Publisher / Subscriber 모델 중앙 집중형 메시지 관리 방식 : 메시지 생성/소비가 완전히 독립되어있는 구조 (비동기 처리) Publisher에서 메시징 플랫폼에 메시지를 발행(push)하면 Subscriber가 데이터를 수신(pull) 수신자가 정해져있지 않음 → 송신자가 ‘전송’ 하는게 아니라 수신자가 ‘Polling’ 하는 방식 Kafka 아키텍쳐 요소 Zookeeper : 분산 코디네이팅 시스템, Kafka Borker 정보 및 Topic 메타정보를 보유함. Broker : 메시지 관리자, Kafka가 실질적으로 구동되는 서버단 Producer : 메시지 생산자, 토픽의 Leader Partition을 .. 2023. 2. 23. 20:14
DEVOCEAN 테크데이 - Kafka 서비스 활용 스터디 사례 참석 후기 2023.02.17 지난주 금요일에 진행되었던 DEVOCEAN Kafka 서비스 활용 스터디 사례에 다녀온 후기를 간단하게 써보고자 한다. 팀 내에서 Kafka 도입을 위해 기술 스터디 겸 R&D를 하면서 열심히 공부하던 중, 이런 행사가 있는데 참석해보라는 팀장님의 추천에 미리 사전등록 후 재택근무 끝나고 판교로 향했다! 날씨가 너무 좋아서 기분도 업된 상태로 30분 만에 도착 😊 10분 정도 일찍 도착했는데 앞에 커피랑 쿠키가 놓여져있어서 하나씩 챙겨와서 앉았더니 꼬마집사님이 DEVOCEAN 홍보도 해주셔서 어플도 깔고 뱃지도 받았다! 2시 되자마자 시작했고, DEVOCEAN 측에서 간단하게 본 행사 소개 후 고승범님의 KAFKA 사용자 모임 소개가 이어졌다. [실전 카프카 개발부터 운영까지] 책으로.. 2023. 2. 20. 23:11