Uses of Class com.google.genai.proto.SentencepieceModel.TrainerSpec.Builder (google-genai 1.61.0-SNAPSHOT API)

Packages that use SentencepieceModel.TrainerSpec.Builder

Package

Description

com.google.genai.proto

Uses of SentencepieceModel.TrainerSpec.Builder in com.google.genai.proto

Methods in com.google.genai.proto that return SentencepieceModel.TrainerSpec.Builder

Modifier and Type

Method

Description

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.addAcceptLanguage(String value)

List of the languages this model can accept.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.addAcceptLanguageBytes(com.google.protobuf.ByteString value)

List of the languages this model can accept.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.addAllAcceptLanguage(Iterable<String> values)

List of the languages this model can accept.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.addAllControlSymbols(Iterable<String> values)

///////////////////////////////////////////////////////////////// Vocabulary management Defines control symbols used as an indicator to change the behavior of the decoder.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.addAllInput(Iterable<String> values)

///////////////////////////////////////////////////////////////// General parameters Input corpus files.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.addAllUserDefinedSymbols(Iterable<String> values)

Defines user defined symbols.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.addControlSymbols(String value)

///////////////////////////////////////////////////////////////// Vocabulary management Defines control symbols used as an indicator to change the behavior of the decoder.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.addControlSymbolsBytes(com.google.protobuf.ByteString value)

///////////////////////////////////////////////////////////////// Vocabulary management Defines control symbols used as an indicator to change the behavior of the decoder.

<Type> SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.addExtension(com.google.protobuf.GeneratedMessage.GeneratedExtension<SentencepieceModel.TrainerSpec,List<Type>> extension, Type value)

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.addInput(String value)

///////////////////////////////////////////////////////////////// General parameters Input corpus files.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.addInputBytes(com.google.protobuf.ByteString value)

///////////////////////////////////////////////////////////////// General parameters Input corpus files.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.addRepeatedField(com.google.protobuf.Descriptors.FieldDescriptor field, Object value)

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.addUserDefinedSymbols(String value)

Defines user defined symbols.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.addUserDefinedSymbolsBytes(com.google.protobuf.ByteString value)

Defines user defined symbols.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.clear()

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.clearAcceptLanguage()

List of the languages this model can accept.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.clearAllowWhitespaceOnlyPieces()

Allows pieces that only contain whitespaces instead of appearing only as prefix or suffix of other pieces.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.clearBosId()

<s>

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.clearBosPiece()

optional string bos_piece = 46 [default = "<s>"];

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.clearByteFallback()

Decomposes unknown pieces into UTF-8 bytes.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.clearCharacterCoverage()

///////////////////////////////////////////////////////////////// Training parameters.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.clearControlSymbols()

///////////////////////////////////////////////////////////////// Vocabulary management Defines control symbols used as an indicator to change the behavior of the decoder.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.clearDifferentialPrivacyClippingThreshold()

Clipping threshold to apply after adding noise.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.clearDifferentialPrivacyNoiseLevel()

Set these parameters if you need DP version of sentencepiece.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.clearEnableDifferentialPrivacy()

Whether to use DP version of sentencepiece.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.clearEosId()

</s>

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.clearEosPiece()

optional string eos_piece = 47 [default = "</s>"];

<T> SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.clearExtension(com.google.protobuf.GeneratedMessage.GeneratedExtension<SentencepieceModel.TrainerSpec,T> extension)

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.clearField(com.google.protobuf.Descriptors.FieldDescriptor field)

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.clearHardVocabLimit()

`vocab_size` is treated as hard limit.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.clearInput()

///////////////////////////////////////////////////////////////// General parameters Input corpus files.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.clearInputFormat()

Input corpus format: "text": one-sentence-per-line text format (default) "tsv": sentence <tab> freq

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.clearInputSentenceSize()

Maximum size of sentences the trainer loads from `input` parameter.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.clearMaxSentenceLength()

The maximum sentence length in byte.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.clearMaxSentencepieceLength()

///////////////////////////////////////////////////////////////// SentencePiece parameters which control the shapes of sentence piece.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.clearMiningSentenceSize()

Deprecated.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.clearModelPrefix()

Output model file prefix.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.clearModelType()

optional .com.google.genai.proto.TrainerSpec.ModelType model_type = 3 [default = UNIGRAM];

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.clearNumSubIterations()

Number of EM sub iterations.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.clearNumThreads()

Number of threads in the training.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.clearOneof(com.google.protobuf.Descriptors.OneofDescriptor oneof)

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.clearPadId()

<pad> (padding)

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.clearPadPiece()

optional string pad_piece = 48 [default = "<pad>"];

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.clearPretokenizationDelimiter()

Defines the pre-tokenization delimiter.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.clearRequiredChars()

Defines required characters.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.clearSeedSentencepiecesFile()

Path to a seed sentencepieces file, with one tab-separated seed sentencepiece <tab> frequency per line.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.clearSeedSentencepieceSize()

The size of seed sentencepieces.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.clearSelfTestSampleSize()

Size of self-test samples, which are encoded in the model file.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.clearShrinkingFactor()

In every EM sub-iterations, keeps top `shrinking_factor` * `current sentencepieces size` with respect to the loss of the sentence piece.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.clearShuffleInputSentence()

optional bool shuffle_input_sentence = 19 [default = true];

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.clearSplitByNumber()

When `split_by_number` is true, put a boundary between number and non-number transition.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.clearSplitByUnicodeScript()

Uses Unicode script to split sentence pieces.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.clearSplitByWhitespace()

Use a white space to split sentence pieces.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.clearSplitDigits()

Split all digits (0-9) into separate pieces.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.clearTrainExtremelyLargeCorpus()

Increase bit depth to allow unigram model training on large (>10M sentences) corpora.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.clearTrainingSentenceSize()

Deprecated.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.clearTreatWhitespaceAsSuffix()

Adds whitespace symbol (_) as a suffix instead of prefix.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.clearUnkId()

///////////////////////////////////////////////////////////////// Reserved special meta tokens.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.clearUnkPiece()

optional string unk_piece = 45 [default = "<unk>"];

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.clearUnkSurface()

Encodes <unk> into U+2047 (DOUBLE QUESTION MARK), since this character can be useful both for user and developer.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.clearUseAllVocab()

use all symbols for vocab extraction.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.clearUserDefinedSymbols()

Defines user defined symbols.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.clearVocabSize()

Vocabulary size.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.clearVocabularyOutputPieceScore()

When creating the vocabulary file, defines whether or not to additionally output the score for each piece.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.clone()

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.ModelProto.Builder.getTrainerSpecBuilder()

Spec used to generate this model file.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.mergeFrom(SentencepieceModel.TrainerSpec other)

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.mergeFrom(com.google.protobuf.CodedInputStream input, com.google.protobuf.ExtensionRegistryLite extensionRegistry)

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.mergeFrom(com.google.protobuf.Message other)

final SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.mergeUnknownFields(com.google.protobuf.UnknownFieldSet unknownFields)

static SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.newBuilder()

static SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.newBuilder(SentencepieceModel.TrainerSpec prototype)

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.newBuilderForType()

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.setAcceptLanguage(int index, String value)

List of the languages this model can accept.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.setAllowWhitespaceOnlyPieces(boolean value)

Allows pieces that only contain whitespaces instead of appearing only as prefix or suffix of other pieces.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.setBosId(int value)

<s>

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.setBosPiece(String value)

optional string bos_piece = 46 [default = "<s>"];

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.setBosPieceBytes(com.google.protobuf.ByteString value)

optional string bos_piece = 46 [default = "<s>"];

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.setByteFallback(boolean value)

Decomposes unknown pieces into UTF-8 bytes.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.setCharacterCoverage(float value)

///////////////////////////////////////////////////////////////// Training parameters.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.setControlSymbols(int index, String value)

///////////////////////////////////////////////////////////////// Vocabulary management Defines control symbols used as an indicator to change the behavior of the decoder.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.setDifferentialPrivacyClippingThreshold(long value)

Clipping threshold to apply after adding noise.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.setDifferentialPrivacyNoiseLevel(float value)

Set these parameters if you need DP version of sentencepiece.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.setEnableDifferentialPrivacy(boolean value)

Whether to use DP version of sentencepiece.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.setEosId(int value)

</s>

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.setEosPiece(String value)

optional string eos_piece = 47 [default = "</s>"];

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.setEosPieceBytes(com.google.protobuf.ByteString value)

optional string eos_piece = 47 [default = "</s>"];

<Type> SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.setExtension(com.google.protobuf.GeneratedMessage.GeneratedExtension<SentencepieceModel.TrainerSpec,List<Type>> extension, int index, Type value)

<Type> SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.setExtension(com.google.protobuf.GeneratedMessage.GeneratedExtension<SentencepieceModel.TrainerSpec,Type> extension, Type value)

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.setField(com.google.protobuf.Descriptors.FieldDescriptor field, Object value)

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.setHardVocabLimit(boolean value)

`vocab_size` is treated as hard limit.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.setInput(int index, String value)

///////////////////////////////////////////////////////////////// General parameters Input corpus files.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.setInputFormat(String value)

Input corpus format: "text": one-sentence-per-line text format (default) "tsv": sentence <tab> freq

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.setInputFormatBytes(com.google.protobuf.ByteString value)

Input corpus format: "text": one-sentence-per-line text format (default) "tsv": sentence <tab> freq

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.setInputSentenceSize(long value)

Maximum size of sentences the trainer loads from `input` parameter.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.setMaxSentenceLength(int value)

The maximum sentence length in byte.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.setMaxSentencepieceLength(int value)

///////////////////////////////////////////////////////////////// SentencePiece parameters which control the shapes of sentence piece.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.setMiningSentenceSize(int value)

Deprecated.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.setModelPrefix(String value)

Output model file prefix.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.setModelPrefixBytes(com.google.protobuf.ByteString value)

Output model file prefix.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.setModelType(SentencepieceModel.TrainerSpec.ModelType value)

optional .com.google.genai.proto.TrainerSpec.ModelType model_type = 3 [default = UNIGRAM];

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.setNumSubIterations(int value)

Number of EM sub iterations.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.setNumThreads(int value)

Number of threads in the training.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.setPadId(int value)

<pad> (padding)

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.setPadPiece(String value)

optional string pad_piece = 48 [default = "<pad>"];

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.setPadPieceBytes(com.google.protobuf.ByteString value)

optional string pad_piece = 48 [default = "<pad>"];

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.setPretokenizationDelimiter(String value)

Defines the pre-tokenization delimiter.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.setPretokenizationDelimiterBytes(com.google.protobuf.ByteString value)

Defines the pre-tokenization delimiter.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.setRepeatedField(com.google.protobuf.Descriptors.FieldDescriptor field, int index, Object value)

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.setRequiredChars(String value)

Defines required characters.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.setRequiredCharsBytes(com.google.protobuf.ByteString value)

Defines required characters.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.setSeedSentencepiecesFile(String value)

Path to a seed sentencepieces file, with one tab-separated seed sentencepiece <tab> frequency per line.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.setSeedSentencepiecesFileBytes(com.google.protobuf.ByteString value)

Path to a seed sentencepieces file, with one tab-separated seed sentencepiece <tab> frequency per line.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.setSeedSentencepieceSize(int value)

The size of seed sentencepieces.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.setSelfTestSampleSize(int value)

Size of self-test samples, which are encoded in the model file.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.setShrinkingFactor(float value)

In every EM sub-iterations, keeps top `shrinking_factor` * `current sentencepieces size` with respect to the loss of the sentence piece.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.setShuffleInputSentence(boolean value)

optional bool shuffle_input_sentence = 19 [default = true];

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.setSplitByNumber(boolean value)

When `split_by_number` is true, put a boundary between number and non-number transition.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.setSplitByUnicodeScript(boolean value)

Uses Unicode script to split sentence pieces.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.setSplitByWhitespace(boolean value)

Use a white space to split sentence pieces.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.setSplitDigits(boolean value)

Split all digits (0-9) into separate pieces.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.setTrainExtremelyLargeCorpus(boolean value)

Increase bit depth to allow unigram model training on large (>10M sentences) corpora.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.setTrainingSentenceSize(int value)

Deprecated.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.setTreatWhitespaceAsSuffix(boolean value)

Adds whitespace symbol (_) as a suffix instead of prefix.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.setUnkId(int value)

///////////////////////////////////////////////////////////////// Reserved special meta tokens.

final SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.setUnknownFields(com.google.protobuf.UnknownFieldSet unknownFields)

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.setUnkPiece(String value)

optional string unk_piece = 45 [default = "<unk>"];

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.setUnkPieceBytes(com.google.protobuf.ByteString value)

optional string unk_piece = 45 [default = "<unk>"];

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.setUnkSurface(String value)

Encodes <unk> into U+2047 (DOUBLE QUESTION MARK), since this character can be useful both for user and developer.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.setUnkSurfaceBytes(com.google.protobuf.ByteString value)

Encodes <unk> into U+2047 (DOUBLE QUESTION MARK), since this character can be useful both for user and developer.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.setUseAllVocab(boolean value)

use all symbols for vocab extraction.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.setUserDefinedSymbols(int index, String value)

Defines user defined symbols.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.setVocabSize(int value)

Vocabulary size.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.Builder.setVocabularyOutputPieceScore(boolean value)

When creating the vocabulary file, defines whether or not to additionally output the score for each piece.

SentencepieceModel.TrainerSpec.Builder

SentencepieceModel.TrainerSpec.toBuilder()

Methods in com.google.genai.proto with parameters of type SentencepieceModel.TrainerSpec.Builder

Modifier and Type

Method

Description

SentencepieceModel.ModelProto.Builder

SentencepieceModel.ModelProto.Builder.setTrainerSpec(SentencepieceModel.TrainerSpec.Builder builderForValue)

Spec used to generate this model file.

Uses of Classcom.google.genai.proto.SentencepieceModel.TrainerSpec.Builder

Uses of SentencepieceModel.TrainerSpec.Builder in com.google.genai.proto

Uses of Class
com.google.genai.proto.SentencepieceModel.TrainerSpec.Builder