gooooooooooose

goooose

goooose

Interested in ML/DL, Data Engineering.

Recent posts

The Era of 1-bit LLMs: All Large Language Models are in 1.58 Bits

March 03 2024

Abstract

Airflow task 디자인

February 09 2024

Apache Airflow 기반의 데이터 파이프라인 책의 내용 중 일부를 정리한 내용입니다.

Finetuning Large Language Models 정리

December 07 2023

Finetuning Large Language Models - Deeplearning.ai

AI Village Capture the Flag @ DEFCON31 후기

November 10 2023

AI 관련 CTF가 있는 줄은 몰랐는데 Kaggle에서 해당 대회가 열려 한번 참가하여 한 달간 풀어봤습니다. 대회에서 사용되는 Capture the Flag(CTF) 방식은 취약점을 통해 주최자가 숨겨둔 플래그를 찾아 문제를 해결할 수 있습니다. 이 대회는 27개의 문제로 이루어...

GAMEFREAK Programming Contest 2023 (AtCoder Beginner Contest 317)

August 29 2023

A. Potions 현재 체력 H에서 $P_i$만큼 회복시킬 수 있는 포션을 먹을 때 체력이 X만큼 차면서 X에 가장 가까운 i를 찾는 문제이다.

Wordpiece Tokenizer

July 07 2023

Reference Wordpiece 토크나이저는 BERT를 사전학습할때 사용했던 토크나이저입니다. BPE(Byte-Pair Encoding) 토크나이저와 방식은 거의 똑같은데 단어를 합치는 부분이 다른점이 특징입니다.

python으로 LSTM 구현하기

June 02 2023

Related RNN에 이어서 LSTM을 구현했습니다.

Byte Pair Encoding

February 19 2023

Reference BPE 알고리즘에 대한 설명은 링크한 곳에 잘 설명되어 있습니다. 여기서는 참고한 곳의 내용을 바탕으로 직접 구현했습니다.

python으로 RNN 구현하기

December 28 2022

Related 이전 포스트에서 CNN을 구현했고 이번에는 RNN을 구현하는 과정을 정리하려고 합니다.

데이터 파이프라인 구축해보기

December 02 2022

Motivation 빅데이터를 지탱하는 기술을 읽다가 데이터 엔지니어링에 사용되는 플랫폼들을 전체 파이프라인으로 구축해보고 싶어서 이 사이드 프로젝트를 진행하게 되었습니다.