Python Token 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: echotorch.transforms.text

메소드/함수: Token

hotexamples.com에서의 예제들: 2

Python Token - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 echotorch.transforms.text.Token에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

파일: sfgram.py 프로젝트: knut0815/EchoTorch

# This program is distributed in the hope that it will be useful, but WITHOUT
# ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or FITNESS
# FOR A PARTICULAR PURPOSE.  See the GNU General Public License for more
# details.
#
# You should have received a copy of the GNU General Public License along with
# this program; if not, write to the Free Software Foundation, Inc., 51
# Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA.
#
# Copyright Nils Schaetti <*****@*****.**>

# Imports
import torch.utils.data
from echotorch import datasets
from echotorch.transforms import text

# Reuters C50 dataset
reutersloader = torch.utils.data.DataLoader(datasets.SFGramDataset(
    tokenizer=text.Token(),
    root="../../data/sfgram/",
    download=True,
    transform=text.GloveVector()),
                                            batch_size=1,
                                            shuffle=True)

# Get training data for this fold
for i, data in enumerate(reutersloader):
    # Inputs and labels
    inputs, labels = data
# end for

예제 #2

파일 보기

parser = argparse.ArgumentParser(description="Word embedding for AA")

# Argument
parser.add_argument("--output", type=str, help="Embedding output file", default='.')
parser.add_argument("--dim", type=int, help="Embedding dimension", default=300)
parser.add_argument("--n-features", type=int, help="Number of features", default=30)
parser.add_argument("--no-cuda", action='store_true', default=False, help="Enables CUDA training")
parser.add_argument("--epoch", type=int, help="Epoch", default=300)
parser.add_argument("--steps", type=int, help="Steps to backwards", default=5)
args = parser.parse_args()

# Use CUDA?
args.cuda = not args.no_cuda and torch.cuda.is_available()

# Word embedding
transform = text.Token()

# Reuters C50 dataset
reutersloader = torch.utils.data.DataLoader(datasets.ReutersC50Dataset(download=True, n_authors=15,
                                                                       transform=transform),
                                            batch_size=1, shuffle=False)

# Token to ix
token_to_ix = dict()
ix_to_token = dict()

# Loss function
# loss_function = nn.NLLLoss()
loss_function = nn.CrossEntropyLoss()

# Set fold and training mode