Python load_wav 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: kaldi_data

메소드/함수: load_wav

hotexamples.com에서의 예제들: 2

Python load_wav - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 kaldi_data.load_wav에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

파일: diarization_dataset.py 프로젝트: yuzhms/RPNSD

    def __getitem__(self, idx):
        uttname = self.uttlist[idx]
        info_filename = "{}/data/{}.txt".format(self.data_dir, uttname)
        assert os.path.exists(info_filename)
        with open(info_filename, 'r') as fh:
            info = fh.readline().strip('\n')
        info_split = info.split(None, 3)
        # each record has 4 fields
        # (1)uttname (2)uttdur (3)label file (4)feature file
        feat_file, label_file = info_split[3], info_split[2]

        # compute STFT feature
        data, samplerate = kaldi_data.load_wav(feat_file)
        Y = feature.stft(data, self.frame_size, self.frame_shift)
        feat = feature.transform(Y, self.input_transform)

        # prepare diarization label
        label = self.process_label_file(label_file)
        second_per_frame = self.frame_shift * 1.0 / self.rate
        label[:, :2] = (label[:, :2] / second_per_frame).astype(int)
        label[:, 2] = label[:, 2] + 1

        if len(label) > self.padded_len:
            print(
                "Warning: length of {} exceeds padded length".format(uttname))
            label = label[:self.padded_len, :]
        label_padded = np.zeros((self.padded_len, 3))
        label_padded[:len(label), :] = label
        return uttname, feat, label_padded, len(label)

예제 #2

파일 보기

파일: diarization_dataset.py 프로젝트: yuzhms/RPNSD

    def __getitem__(self, idx):
        uttname = self.uttlist[idx]
        data, samplerate = kaldi_data.load_wav(self.utt2ark[uttname])
        Y = feature.stft(data, self.frame_size, self.frame_shift)
        feat = feature.transform(Y, self.input_transform)

        seg_list = self.utt2seg[uttname]
        label = self.process_label(seg_list)
        second_per_frame = self.frame_shift * 1.0 / self.rate
        label[:, :2] = (label[:, :2] / second_per_frame).astype(int)
        label[:, 2] = label[:, 2] + 1
        return uttname, feat, label