Python CharSetProberの例、charsetprober.CharSetProber Pythonの例

コード例 #1

0

ファイルを表示

ファイル: mbcharsetprober.py プロジェクト: 3cky/3

	def reset(self):
		CharSetProber.reset(self)
		if self._mCodingSM:
			self._mCodingSM.reset()
		if self._mDistributionAnalyzer:
			self._mDistributionAnalyzer.reset()
		self._mLastChar = ['\x00', '\x00']

コード例 #2

0

ファイルを表示

ファイル: sbcharsetprober.py プロジェクト: AlexisMarie8330/Doll

 def reset(self):
     CharSetProber.reset(self)
     self._mLastOrder = 255  # char order of last character
     self._mSeqCounters = [0] * NUMBER_OF_SEQ_CAT
     self._mTotalSeqs = 0
     self._mTotalChar = 0
     self._mFreqChar = 0  # characters that fall in our sampling range

コード例 #3

0

ファイルを表示

ファイル: mbcharsetprober.py プロジェクト: 5l1v3r1/Golismero-1

 def reset(self):
     CharSetProber.reset(self)
     if self._mCodingSM:
         self._mCodingSM.reset()
     if self._mDistributionAnalyzer:
         self._mDistributionAnalyzer.reset()
     self._mLastChar = ['\x00', '\x00']

コード例 #4

0

ファイルを表示

ファイル: sbcharsetprober.py プロジェクト: 00zl00/AlfredWorkflow.com

 def reset(self):
     CharSetProber.reset(self)
     self._mLastOrder = 255 # char order of last character
     self._mSeqCounters = [0] * NUMBER_OF_SEQ_CAT
     self._mTotalSeqs = 0
     self._mTotalChar = 0
     self._mFreqChar = 0 # characters that fall in our sampling range

コード例 #5

0

ファイルを表示

ファイル: mbcharsetprober.py プロジェクト: barak066/python-chardet

 def reset(self):
     CharSetProber.reset(self)
     if self._mCodingSM:
         self._mCodingSM.reset()
     if self._mDistributionAnalyzer:
         self._mDistributionAnalyzer.reset()
     self._mLastChar = [_bytechar(0), _bytechar(0)]

コード例 #6

0

ファイルを表示

ファイル: mbcharsetprober.py プロジェクト: barak066/python-chardet

 def reset(self):
     CharSetProber.reset(self)
     if self._mCodingSM:
         self._mCodingSM.reset()
     if self._mDistributionAnalyzer:
         self._mDistributionAnalyzer.reset()
     self._mLastChar = [_bytechar(0), _bytechar(0)]

コード例 #7

0

ファイルを表示

ファイル: escprober.py プロジェクト: Ettack/csqlmap

 def reset(self):
     CharSetProber.reset(self)
     for codingSM in self._mCodingSM:
         if not codingSM: continue
         codingSM.active = constants.True
         codingSM.reset()
     self._mActiveSM = len(self._mCodingSM)
     self._mDetectedCharset = None

コード例 #8

0

ファイルを表示

 def reset(self):
     CharSetProber.reset(self)
     for codingSM in self._mCodingSM:
         if not codingSM: continue
         codingSM.active = True
         codingSM.reset()
     self._mActiveSM = len(self._mCodingSM)
     self._mDetectedCharset = None

コード例 #9

0

ファイルを表示

ファイル: charsetgroupprober.py プロジェクト: AlexisMarie8330/Doll

 def reset(self):
     CharSetProber.reset(self)
     self._mActiveNum = 0
     for prober in self._mProbers:
         if prober:
             prober.reset()
             prober.active = constants. True
             self._mActiveNum += 1
     self._mBestGuessProber = None

コード例 #10

0

ファイルを表示

ファイル: escprober.py プロジェクト: Ettack/csqlmap

 def __init__(self):
     CharSetProber.__init__(self)
     self._mCodingSM = [ \
         CodingStateMachine(HZSMModel),
         CodingStateMachine(ISO2022CNSMModel),
         CodingStateMachine(ISO2022JPSMModel),
         CodingStateMachine(ISO2022KRSMModel)
         ]
     self.reset()

コード例 #11

0

ファイルを表示

 def __init__(self):
     CharSetProber.__init__(self)
     self._mCodingSM = [ \
         CodingStateMachine(HZSMModel),
         CodingStateMachine(ISO2022CNSMModel),
         CodingStateMachine(ISO2022JPSMModel),
         CodingStateMachine(ISO2022KRSMModel)
         ]
     self.reset()

コード例 #12

0

ファイルを表示

ファイル: charsetgroupprober.py プロジェクト: 00zl00/AlfredWorkflow.com

 def reset(self):
     CharSetProber.reset(self)
     self._mActiveNum = 0
     for prober in self._mProbers:
         if prober:
             prober.reset()
             prober.active = constants.True
             self._mActiveNum += 1
     self._mBestGuessProber = None

コード例 #13

0

ファイルを表示

ファイル: macromanprober.py プロジェクト: LuminosoInsight/chardet

    def reset(self):
        self._mLastCharClass = OTH
        self._mFreqCounter = [0] * FREQ_CAT_NUM

        # express the prior that MacRoman is a somewhat rare encoding;
        # this can be done by starting out in a slightly improbable state
        # that must be overcome
        self._mFreqCounter[2] = 10

        CharSetProber.reset(self)

コード例 #14

0

ファイルを表示

ファイル: mbcharsetprober.py プロジェクト: 3cky/3

	def __init__(self):
		CharSetProber.__init__(self)
		self._mDistributionAnalyzer = None
		self._mCodingSM = None
		self._mLastChar = ['\x00', '\x00']

コード例 #15

0

ファイルを表示

ファイル: mbcharsetprober.py プロジェクト: barak066/python-chardet

 def __init__(self):
     CharSetProber.__init__(self)
     self._mDistributionAnalyzer = None
     self._mCodingSM = None
     self._mLastChar = [_bytechar(0), _bytechar(0)]

コード例 #16

0

ファイルを表示

ファイル: charsetgroupprober.py プロジェクト: 00zl00/AlfredWorkflow.com

 def __init__(self):
     CharSetProber.__init__(self)
     self._mActiveNum = 0
     self._mProbers = []
     self._mBestGuessProber = None

コード例 #17

0

ファイルを表示

ファイル: utf8prober.py プロジェクト: norhap/enigma2-plugins-1

 def __init__(self):
     CharSetProber.__init__(self)
     self._mCodingSM = CodingStateMachine(UTF8SMModel)
     self.reset()

コード例 #18

0

ファイルを表示

ファイル: mbcharsetprober.py プロジェクト: 5l1v3r1/Golismero-1

 def __init__(self):
     CharSetProber.__init__(self)
     self._mDistributionAnalyzer = None
     self._mCodingSM = None
     self._mLastChar = ['\x00', '\x00']

コード例 #19

0

ファイルを表示

ファイル: latin1prober.py プロジェクト: toddlerya/PyWebGet

 def reset(self):
     self._mLastCharClass = OTH
     self._mFreqCounter = [0] * FREQ_CAT_NUM
     CharSetProber.reset(self)

コード例 #20

0

ファイルを表示

ファイル: sbcharsetprober.py プロジェクト: 00zl00/AlfredWorkflow.com

import constants, sys
from charsetprober import CharSetProber

SAMPLE_SIZE = 64
SB_ENOUGH_REL_THRESHOLD = 1024
POSITIVE_SHORTCUT_THRESHOLD = 0.95
NEGATIVE_SHORTCUT_THRESHOLD = 0.05
SYMBOL_CAT_ORDER = 250
NUMBER_OF_SEQ_CAT = 4
POSITIVE_CAT = NUMBER_OF_SEQ_CAT - 1
#NEGATIVE_CAT = 0
 
class SingleByteCharSetProber(CharSetProber):
    def __init__(self, model, reversed=constants.False, nameProber=None):
        CharSetProber.__init__(self)
        self._mModel = model
        self._mReversed = reversed # TRUE if we need to reverse every pair in the model lookup
        self._mNameProber = nameProber # Optional auxiliary prober for name decision
        self.reset()

    def reset(self):
        CharSetProber.reset(self)
        self._mLastOrder = 255 # char order of last character
        self._mSeqCounters = [0] * NUMBER_OF_SEQ_CAT
        self._mTotalSeqs = 0
        self._mTotalChar = 0
        self._mFreqChar = 0 # characters that fall in our sampling range

    def get_charset_name(self):
        if self._mNameProber:

コード例 #21

0

ファイルを表示

ファイル: utf8prober.py プロジェクト: norhap/enigma2-plugins-1

 def reset(self):
     CharSetProber.reset(self)
     self._mCodingSM.reset()
     self._mNumOfMBChar = 0

コード例 #22

0

ファイルを表示

ファイル: latin1prober.py プロジェクト: toddlerya/PyWebGet

 def __init__(self):
     CharSetProber.__init__(self)
     self.reset()

コード例 #23

0

ファイルを表示

 def __init__(self):
     CharSetProber.__init__(self)
     self._mLogicalProber = None
     self._mVisualProber = None
     self.reset()

コード例 #24

0

ファイルを表示

ファイル: charsetgroupprober.py プロジェクト: AlexisMarie8330/Doll

 def __init__(self):
     CharSetProber.__init__(self)
     self._mActiveNum = 0
     self._mProbers = []
     self._mBestGuessProber = None

コード例 #25

0

ファイルを表示

ファイル: hebrewprober.py プロジェクト: 3cky/3

	def __init__(self):
		CharSetProber.__init__(self)
		self._mLogicalProber = None
		self._mVisualProber = None
		self.reset()

コード例 #26

0

ファイルを表示

ファイル: sbcharsetprober.py プロジェクト: AlexisMarie8330/Doll

from charsetprober import CharSetProber

SAMPLE_SIZE = 64
SB_ENOUGH_REL_THRESHOLD = 1024
POSITIVE_SHORTCUT_THRESHOLD = 0.95
NEGATIVE_SHORTCUT_THRESHOLD = 0.05
SYMBOL_CAT_ORDER = 250
NUMBER_OF_SEQ_CAT = 4
POSITIVE_CAT = NUMBER_OF_SEQ_CAT - 1

#NEGATIVE_CAT = 0


class SingleByteCharSetProber(CharSetProber):
    def __init__(self, model, reversed=constants. False, nameProber=None):
        CharSetProber.__init__(self)
        self._mModel = model
        self._mReversed = reversed  # TRUE if we need to reverse every pair in the model lookup
        self._mNameProber = nameProber  # Optional auxiliary prober for name decision
        self.reset()

    def reset(self):
        CharSetProber.reset(self)
        self._mLastOrder = 255  # char order of last character
        self._mSeqCounters = [0] * NUMBER_OF_SEQ_CAT
        self._mTotalSeqs = 0
        self._mTotalChar = 0
        self._mFreqChar = 0  # characters that fall in our sampling range

    def get_charset_name(self):
        if self._mNameProber:

コード例 #27

0

ファイルを表示

 def __init__(self):
     CharSetProber.__init__(self)
     self.reset()

コード例 #28

0

ファイルを表示

ファイル: ex41.py プロジェクト: christofoo/hard-way

 def reset(self):
     CharSetProber.reset(self)
     self._mCodingSM.reset()
     self._mNumOfMBChar = 0

コード例 #29

0

ファイルを表示

ファイル: ex41.py プロジェクト: christofoo/hard-way

 def __init__(self):
     CharSetProber.__init__(self)
     self._mCodingSM = CodingStateMachine(UTF8SMModel)
     self.reset()

コード例 #30

0

ファイルを表示

 def reset(self):
     self._mLastCharClass = OTH
     self._mFreqCounter = [0] * FREQ_CAT_NUM
     CharSetProber.reset(self)

コード例 #31

0

ファイルを表示

ファイル: mbcharsetprober.py プロジェクト: barak066/python-chardet

 def __init__(self):
     CharSetProber.__init__(self)
     self._mDistributionAnalyzer = None
     self._mCodingSM = None
     self._mLastChar = [_bytechar(0), _bytechar(0)]

コード例 #32

0

ファイルを表示

ファイル: sbcharsetprober.py プロジェクト: barak066/python-chardet

 def __init__(self, model, reversed=False, nameProber=None):
     CharSetProber.__init__(self)
     self._mModel = model
     self._mReversed = reversed # TRUE if we need to reverse every pair in the model lookup
     self._mNameProber = nameProber # Optional auxiliary prober for name decision
     self.reset()

コード例 #33

0

ファイルを表示

 def __init__(self, model, reversed=False, nameProber=None):
     CharSetProber.__init__(self)
     self._mModel = model
     self._mReversed = reversed  # TRUE if we need to reverse every pair in the model lookup
     self._mNameProber = nameProber  # Optional auxiliary prober for name decision
     self.reset()