深度探索數位世界 - 2. 語音資料集預處理與語音轉換模型訓練

National Taiwan Normal University Gongguan Campus, 88 Section 4, Tingzhou Road, Wenshan District, 116

GDG on Campus National Taiwan Normal University - Taipei, Taiwan

1.預處理語音資料集 2.在 Hugging Face 上管理資料集 3.微調語音轉換(VC)模型

Dec 5, 11:00 AM – 1:00 PM (UTC)

4 RSVP'd

RSVP

Key Themes

Data

About this event

2.1 預處理語音資料集

清理:降噪、修剪靜音、音量標準化。

使用工具:Audacity、Python 腳本。

2.2 在 Hugging Face 上管理資料集

上傳並記錄資料集,建立完整的資料集卡片。

實作:上傳個人語音資料集至 Hugging Face。

2.3 微調語音轉換(VC)模型

在 Colab 上使用 Hugging Face Transformers 訓練模型。

實作:訓練並測試語音轉換模型,使用 Gradio 即時互動介面進行測試。

Speaker

  • Jacob Lin

    NTNU

    GDG on Campus

Organizers

  • Jacob Lin

    GDG on Campus: National Taiwan Normal University

    Organizer

  • 蓉敬

    NTNU

    DSC President (CT)

  • 柔蓁

    VP of Marketing and Public Relations (CT)

  • th De

    VP of Course Planning and Scheduling (CT)

  • 汪聖芸 台師大

    VP of Event Planning and Operations (CT)

  • 琬茜

    Course Coordinator (CT)

  • 品頤

    Community Manager (CT)

  • Natalie Hsu

    Artist (CT)

  • Sky Hong

    臺師大學生開發者社群

    Podcast Host (CT, GDSC '23 Lead)

  • Maxx Ng

    Project Lead (CT)

  • Ryan Lin

    Project Lead (CT)

  • 蕭文洋 台師大

    Project Lead (CT)

  • qung ning

    Project Lead (CT)

  • Max Cho

    Project Lead (CT)

  • Takala Wang

    National Taiwan Normal University

    Lecturer (CT)

  • 詠傑

    Lecturer (CT)

  • 俊生

    Lecturer (CT)

Contact Us