Skip to content

Pseudo-Lab/EfficientLLM

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

28 Commits
 
 
 
 

Repository files navigation

EfficientLLM: Speed always wins

PseudoLab Discord Community Stars Badge Forks Badge Pull Requests Badge Issues Badge GitHub contributors

speed always wins

🚀 EfficientLLM: Speed always wins repository에 오신 것을 환영합니다! 저희는 Transformer 아키텍처의 근본적인 비효율성을 탐구하고, Sparse AttentionSpeculative Decoding 같은 최신 최적화 기술들을 깊이 있게 다룹니다. 우리의 목표는 Large Language Models의 성능 장벽을 돌파하는 것입니다. LLM을 더 빠르고, 더 효율적이며, 더 쉽게 접근할 수 있도록 만드는 여정에 함께해주세요!

🌟 프로젝트 목표 (Project Vision)

"아키텍처 수준의 깊이 있는 이해를 통해 LLM 추론의 현실적인 장벽을 넘어서다"

Transformer의 $O(N^2)$ 복잡도, 막대한 메모리 요구량은 Long-Context, AI Agent와 같은 차세대 AI 어플리케이션의 가장 큰 병목입니다. 수 조원의 데이터센터, 수 억원의 서빙 비용은 혁신적인 LLM 개발과 서비스를 가로막는 현실적인 장벽이 되고 있습니다.

본 프로젝트는 LLM 추론 효율을 높이기 위한 두 가지 핵심 축, Sparse AttentionSpeculative Decoding을 중심으로 최신 연구들을 탐구하여 다음과 같은 역량을 갖추는 것을 목표로 합니다.

  • 핵심 원리 이해: 각 최적화 기술의 작동 방식을 아키텍처 수준에서 깊이 있게 이해합니다.
  • 통찰력 확보: 어떤 상황에서 어떤 기술이 효과적인지에 대한 통찰력을 기릅니다.
  • 문제 해결 능력: 비용과 속도의 제약을 해결할 수 있는 실질적인 역량을 갖춥니다.
  • 지식 공유: 모든 학습 결과물을 공개하여 국내 LLM 생태계에 기여합니다.

🧑 역동적인 팀 소개 (Dynamic Team)

역할 이름 LinkedIn
Project Manager 전경호 LinkedIn
Member 길재은 LinkedIn
Member 김승우 LinkedIn
Member 김형균 LinkedIn
Member 박재욱 LinkedIn
Member 이승아 LinkedIn

💻 주차별 활동 (Activity History)

  • 시간: 매주 화요일 20:00-22:00
  • 장소: Room-AT
날짜 내용 발표자 영상
2025/9/9 OT 전경호
2025/9/16 Speed Always Wins: A Survey on Efficient Architectures for Large Language Models
Unlocking Efficiency in Large Language Model Inference: A Comprehensive Survey of Speculative Decoding
전경호
길재은
2025/9/23 vLLM 박재욱
이승아
2025/9/30 김승우
김형균
2025/10/7 전경호
길재은
2025/10/14 박재욱
이승아
2025/10/21 김승우
김형균
2025/10/30 전경호
길재은
2025/11/4 박재욱
이승아
2025/11/11 김승우
김형균
2025/11/18 전경호
길재은
2025/11/25 박재욱
이승아
2025/12/2 김승우
김형균
2025/12/9 전경호
길재은
2025/12/16 박재욱
이승아
2025/12/23 김승우
김형균

💡 학습 자원 (Learning Resources)

핵심 Survey 논문

논문 탐색을 위한 레포지토리

🌱 참여 안내 (How to Engage)

  • 빌더로 참여 — 프로젝트 기획·운영 주도
  • 러너로 참여 — 연구·개발·테스트 등 실행
  • 청강 참여 — 공개 세션 참여 가능

❗️참여 링크: 가짜연구소 디스코드 ❗️커뮤니케이션 채널: 디스코드 #{{채널명}}

누구나 청강을 통해 모임을 참여하실 수 있습니다.

  1. 특별한 신청 없이 정기 모임 시간에 맞추어 디스코드 #Room-GH 채널로 입장
  2. Magical Week 중 행사에 참가
  3. Pseudo Lab 행사에서 만나기

Acknowledgement 🙏

이 프로젝트는 가짜연구소 Open Academy로 진행됩니다. 여러분의 참여와 기여가 ‘우연한 혁명(Serendipity Revolution)’을 가능하게 합니다. 모두에게 깊은 감사를 전합니다. OOO is developed as part of Pseudo-Lab's Open Research Initiative. Special thanks to our contributors and the open source community for their valuable insights and contributions.

About Pseudo Lab 👋🏼

Pseudo-Lab is a non-profit organization focused on advancing machine learning and AI technologies. Our core values of Sharing, Motivation, and Collaborative Joy drive us to create impactful open-source projects. With over 5k+ researchers, we are committed to advancing machine learning and AI technologies.

Contributors 😃



License 🗞

This project is licensed under the MIT License.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published