深度探索數位世界 - 2. 語音資料集預處理與語音轉換模型訓練

National Taiwan Normal University Gongguan Campus, 88 Section 4, Tingzhou Road, Wenshan District, 116

GDG on Campus National Taiwan Normal University - Taipei, Taiwan

1.預處理語音資料集 2.在 Hugging Face 上管理資料集 3.微調語音轉換(VC)模型

Dec 5, 2024, 11:00 AM – 1:00 PM (UTC)

5 RSVP'd

Key Themes

Data

About this event

2.1 預處理語音資料集

清理:降噪、修剪靜音、音量標準化。

使用工具:Audacity、Python 腳本。

2.2 在 Hugging Face 上管理資料集

上傳並記錄資料集,建立完整的資料集卡片。

實作:上傳個人語音資料集至 Hugging Face。

2.3 微調語音轉換(VC)模型

在 Colab 上使用 Hugging Face Transformers 訓練模型。

實作:訓練並測試語音轉換模型,使用 Gradio 即時互動介面進行測試。

Speaker

  • Jacob Lin

    NTNU

    GDG on Campus

Organizers

  • Andy Lu

    GDG on Campus Lead

  • 蓉敬

    NTNU

    DSC President ('24)

  • 聖詠

    DSC President('25)

  • 承希

    Lecture Speaker & Project Lead ('25)

  • 恩立

    Lecture Speaker & Project Lead & Administrator

  • RisingWave Labs

    Lecture Speaker & Project Lead & Administrator

  • Xin Shao Hon

    Administrator

  • 乃云

    Administrator

  • 柏諺

    Academia Sinica

    Lecture Speaker

Contact Us