Emulador Sudachi (2025-02-07-v1.0.14-daa6cb0)

Sudachi (2025-02-07-v1.0.14-daa6cb0)

07/02/2025 17:10:16

Changelog:

Highlights
Behavior of the dictionary printer and builder are changed (#234)
DictionaryPrinter now prints word references in the (Surface, POS, Reading) triple format, instead of the line number format.
DictionaryBuilder now allows the dictionary form to be written in the triple format, not only the line number format.
Added
Benchmark scripts are added (#235)
Fixed
Tutorial and readme are updated (#237, #240)
Config.Resource.asByteBuffer now always returns ByteBuffer with little endian byte order (#239)
StringUtil.readAllBytes also now returns ByteBuffer with little endian byte order.
Highlights
Add Tokenizer.lazyTokenizeSentences(SplitMode mode, Readable input), that performs analysis lazily and saves memory usage (#231)
Tokenizer.tokenizeSentences(SplitMode mode, Reader input) is marked as deprecated.
Fixed
Do not segfault on tokenizing with closed dictionary (#217)
The default config sudachi.json sets non-existent property joinKanjiNumeric in JoinNumericPlugin (#221)
fix incorrect size calculation when expand (#227)
Update tutorial.md (#226)

Atualizações:

Destaques
O comportamento do impressor e construtor de dicionário foi alterado (#234)
O DictionaryPrinter agora imprime as referências de palavras no formato de tripla (Surface, POS, Reading), em vez do formato de número de linha.
O DictionaryBuilder agora permite que a forma do dicionário seja escrita no formato de tripla, e não apenas no formato de número de linha.
Adicionado
Scripts de benchmark foram adicionados (#235)
Corrigido
Tutorial e readme atualizados (#237, #240)
Config.Resource.asByteBuffer agora sempre retorna ByteBuffer com ordem de bytes little endian (#239)
StringUtil.readAllBytes agora também retorna ByteBuffer com ordem de bytes little endian.
Destaques
Adicionado Tokenizer.lazyTokenizeSentences(SplitMode mode, Readable input), que realiza a análise de forma preguiçosa e economiza o uso de memória (#231)
Tokenizer.tokenizeSentences(SplitMode mode, Reader input) está marcado como obsoleto.
Corrigido
Não causar falha de segmentação ao tokenizar com o dicionário fechado (#217)
A configuração padrão sudachi.json define a propriedade inexistente joinKanjiNumeric no JoinNumericPlugin (#221)
Corrigido cálculo incorreto de tamanho ao expandir (#227)
Atualizado tutorial.md (#226)

Downloads:
Windows

Sudachi (2025-02-07-v1.0.14-daa6cb0)

Comentários

Deixe um comentário Cancelar resposta

Sudachi (2025-02-07-v1.0.14-daa6cb0)

Emuladores Relacionados

Comentários

Deixe um comentário Cancelar resposta