Python TMUtils.lang2shortの例

プログラミング言語: Python

名前空間/パッケージ名: TMDbApi.TMUtils

クラス/型: TMUtils

メソッド/関数: lang2short

hotexamples.comのコード掲載数: 3

Python TMUtils.lang2short - 3件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのTMDbApi.TMUtils.TMUtils.lang2shortの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

lang2es_index(18)

es_index2mapdb(9)

date2str(8)

lang2short(3)

list2str(2)

str2list(2)

detect_lang(1)

es_index2lang(1)

コード例 #1

ファイルを表示

ファイル: TMXParser.py プロジェクト: MittagQI/nectm

  def _fill_lang(self, tuv, seg):
    d = dict()
    d['source_language'] = TMUtils.lang2short(self._get_lang(tuv[0]))#tuv[0].attrib.get('lang')#get('{%s}lang' % self.NS)
    d['target_language'] = TMUtils.lang2short(self._get_lang(tuv[1])) #tuv[1].attrib.get('lang')#get('{%s}lang' % self.NS)

    d['source_text'] = self._get_text(seg[0])
    if isinstance(d['source_text'], bytes):
      d['source_text'] = d['source_text'].decode('utf8').encode('utf8')

    d['target_text'] = self._get_text(seg[1])
    if isinstance(d['target_text'], bytes):
      d['target_text'] = d['target_text'].decode('utf8').encode('utf8')

    d['source_metadata'] = self._parse_metadata(tuv[0])
    d['target_metadata'] = self._parse_metadata(tuv[1])
    return d

コード例 #2

ファイルを表示

  def _segment2doc(self, segment, ftype):
    text_pos = getattr(segment, ftype + '_pos')
    doc = {'text': getattr(segment, ftype + '_text')}
    # Optional fields (POS, tokenized)
    if hasattr(segment, ftype + '_pos'):
      doc['pos'] = getattr(segment, ftype + '_pos')

    op_ftype = 'source' if ftype == 'target' else 'target'
    # Auxiliary field to facilitate language matrix generation
    doc['target_language'] = [TMUtils.lang2short(TMUtils.str2list(getattr(segment, op_ftype + '_language'))[0])]
    doc['token_cnt'] = self.token_count(getattr(segment, ftype + '_text'), getattr(segment, ftype + '_language'))
    return doc

コード例 #3

ファイルを表示

ファイル: TMXParser.py プロジェクト: MittagQI/nectm

  def _gen_lang_pairs(self, tuv, seg):
    # Get all languages in the given tu
    lang_map = dict()
    for tu, seg in zip(tuv, seg):
      #lang = TMUtils.lang2short(tu.attrib.get('{%s}lang' % self.NS))
      lang = TMUtils.lang2short((self._get_lang(tu)))#(tu.attrib.get('lang'))
      if not lang in lang_map: lang_map[lang] = []
      lang_map[lang].append((tu, seg))

    # Generate all requested pairs (note: one tu can contain multiple translations for
    # the same language
    for s_lang, t_lang in self.lang_pairs:
      for s_tuv, s_seg in lang_map.get(s_lang, []):
        for t_tuv, t_seg in lang_map.get(t_lang, []):
          yield self._fill_lang((s_tuv, t_tuv), (s_seg, t_seg))