조은기록

IT 개발 일지와 일상의 공유

개발일지/AI

[Paper Review] Open FinLLM Leaderboard: Towards Financial AI Readiness

은기조아 2025. 3. 15. 17:52

논문 링크: https://arxiv.org/pdf/2501.10963

FinGPT Search Agents

Open FinLLM Leaderboard

  • Evaluation Framework: LLM의 Multi-modal 능력에 대한 투명하고 표준적인 평가 프레임워크 제공
    • 제로샷 (zero-shot) 평가: w/o Fine-tuning on the task-specific dataset
    • 모델 설치: API or Huggingface
    • 평가 지표: Task 별 적합한 평가 지표 측정 및 Min-Max Scaling을 통한 Normalization 수행
더보기

Multimodal Performance:

- Task: Financial Reporting, Sentiment Analysis, Stock Prediction

- Multimodal: Text, Table, Numerical data, and structured format like XBRL

리더보드 평가 금융 태스크

Related Works

  1. FinLLM
    • BloombergGPT
    • FinGPT
  2. Benchmark
    • FinBen
      • 24 tasks / 46 datasets
      • GPT-4, Gemini와 같은 모델을 평가하는 Framework 제공
      • Task: Information Extraction, Question Answering, Stock Trading, etc.
    • FinanceBench
      • Financial Question Answering에 치중. 150개의 질의 공개

금융 벤치마크 태스크
금융 데이터셋 소스 경로

 

'개발일지 > AI' 카테고리의 다른 글

[Quantization] 이론 이해 및 정리  (0) 2024.10.01
[Multimodal] Introduction  (1) 2024.09.08