DL4J中文文件/模型/層

阿新 • • 發佈：2018-11-19

什麼是層?

神經網路配置中的每一層表示隱藏單元的單元。當層堆疊在一起時，它們代表了一個深度神經網路。

使用層

在Eclipse DL4J中可用的所有層都可以用在多層網路或計算圖中。當配置一個神經網路時，你傳遞層配置，網路會為你例項化該層。

層VS頂點

如果你正在配置諸如InceptionV4之類的複雜網路，則需要使用計算圖API，並使用頂點將不同的分支連線在一起。檢查頂點以獲取更多資訊。

通用層

ActivationLayer （啟用層）

啟用層是一個簡單的層，它將指定的啟用函式應用到輸入啟用中。

clone

public ActivationLayer clone()

引數 activation 用於層的啟用函式

activation

public Builder activation(String activationFunction)

層啟用函式，典型的值包括：
“relu” (校正線性), “tanh”, “sigmoid”, “softmax”, “hardtanh”, “leakyrelu”, “maxout”, “softsign”, “softplus”

棄用使用{- link #activation(Activation)} 或 {- link - activation(IActivation)}

activation

public Builder activation(IActivation activationFunction)

引數 activationFunction 用於層的啟用函式

activation

public Builder activation(Activation activation)

引數 activation 用於層的啟用函式

DenseLayer （密連層）

密連層: 標準全連線前饋層

hasBias

public Builder hasBias(boolean hasBias)

如果為 true (預設): 包括模型偏置引數。false: 沒有偏置。

引數 hasBias如果 true: 包括模型偏置引數

DropoutLayer （丟棄層）

丟棄層。此層僅在訓練時應用丟棄，並在測試時通過未修改層傳遞啟用。

build

public DropoutLayer build()

用指定的保留輸入啟用概率建立一個丟棄層 {- link Dropout}, with the specified probability of retaining the input activation. 詳見 {- link Dropout}

引數 dropout 是啟用保留概率。

EmbeddingLayer（嵌入層）

嵌入層：前饋層，它期望每個示例的單個整數作為輸入（類號，在0到numClass-1的範圍內），從數學上說，嵌入層等效於對輸入使用一個具有one-hot表示的密連層；但是，與大量的類（作為一個密連層+one-hot輸入，一個矩陣乘以所有，但一個值為零）一起，它可以更加有效。
注意: 只能用作網路的第一層
注意 2: 對於給定的示例索引i，輸出是activationFunction(weights.getRow(i) + bias)，因此可以將權重行視為每個示例的向量/嵌入。

還要注意，嵌入層具有啟用函式（IDENTITY設定為禁用）和可選的偏置（預設情況下禁用）

hasBias

public Builder hasBias(boolean hasBias)

如果為 true (預設): 包括層偏置引數。false: 沒有偏置。

引數 hasBias如果 true: 包括層偏置引數

EmbeddingSequenceLayer （嵌入序列層）

序列嵌入層：前向層，它期望每個示例的固定長度整數/索引數（輸入長度）作為輸入，範圍從0到numClasses-1。因此，該輸入具有形狀[ numExamples,inputLength]或形狀[numExamples, 1, inputLength]。

該層的輸出是3D（序列/時間序列），即形狀 [numExamples, nOut, inputLength]。注意：只能用作網路的第一個層。

注2：對於給定的示例索引i，輸出是activationFunction(weights.getRow(i) + bias)，因此可以將權重行視為每個索引的向量/嵌入。

還要注意，嵌入層具有啟用函式（IDENTITY設定為禁用）和可選的偏置（預設情況下禁用）

hasBias

public Builder hasBias(boolean hasBias)

如果為 true (預設): 包括層偏置引數。false: 沒有偏置。

引數 hasBias如果 true: 包括層偏置引數

inputLength

public Builder inputLength(int inputLength)

設定此嵌入層的輸入序列長度。

引數 inputLength 為輸入序列長度
返回 Builder

inferInputLength

public Builder inferInputLength(boolean inferInputLength)

設定嵌入層的輸入序列推理模式。

引數 inferInputLength 是否推斷輸入的長度
返回Builder

GlobalPoolingLayer （全域性池化層）

全域性池化層-用於在時間上對RNNs進行池化，以及用於CNNs的2D池化。

當處理可變長度的輸入時，全域性池化層也可以處理掩模陣列。掩模陣列被假定為2D，並且在訓練中或訓練後通過網路向前饋送：

時間序列：掩碼陣列是形狀是 [miniBatchSize, maxTimeSeriesLength]，並且僅包含0或1個值。
CNNs: 掩碼有形狀 [miniBatchSize, height] 或 [miniBatchSize, width]。重要的是: 當前的實現假設 CNNs + 可變長度（掩碼）, 輸入形狀是 [miniBatchSize, channels, height, 1] 或 [miniBatchSize, channels, 1, width] 。這是像CNN之類的結構進行全域性分類的句子分類。

預設設定的行為：

3d (時間序列) 輸入帶有形狀 [miniBatchSize, vectorSize, timeSeriesLength] -> 2d 輸出 [miniBatchSize, vectorSize]
4d (CNN) 輸入帶有形狀 [miniBatchSize, channels, height, width] -> 2d 輸出 [miniBatchSize, channels]
5d (CNN3D) 輸入帶有形狀 [miniBatchSize, channels, depth, height, width] -> 2d 輸出 [miniBatchSize, channels]

或者，通過在配置中設定collapseDimensions＝false，可以將簡化維度保留為1s：這給出了

[miniBatchSize, vectorSize, 1] 用於 RNN 輸出,
[miniBatchSize, channels, 1, 1] 用於 CNN 輸出, 並
[miniBatchSize, channels, 1, 1, 1] 用於 CNN3D 輸出.

poolingDimensions

public Builder poolingDimensions(int... poolingDimensions)

池化維度。注意: 大多數情況下，這不需要設定，並且可以使用預設值。預設的RNN資料：池化維度2（時間）。CNN資料的預設值：池化維度2,3（高度和寬度）CNN3D資料的預設值：池化維度2,3,4（深度、高度和寬度）

引數 poolingDimensions 用於池化的維度

poolingType

public Builder poolingType(PoolingType poolingType)

引數 poolingType 全域性池化型別

collapseDimensions

public Builder collapseDimensions(boolean collapseDimensions)

在池化時是否摺疊維度。通常你想這樣做。預設值：true。如果是true：

3d (時間系列) 輸入帶有形狀 [miniBatchSize, vectorSize, timeSeriesLength] -> 2d 輸出 [miniBatchSize, vectorSize]
4d (CNN) 輸入帶有形狀 [miniBatchSize, channels, height, width] -> 2d 輸出 [miniBatchSize, channels]
5d (CNN3D) 輸入帶有形狀 [miniBatchSize, channels, depth, height, width] -> 2d 輸出 [miniBatchSize, channels]

如果是 false:

3d (時間系列) 輸入帶有形狀[miniBatchSize, vectorSize, timeSeriesLength] -> 3d 輸出 [miniBatchSize, vectorSize, 1]
4d (CNN)輸入帶有形狀 [miniBatchSize, channels, height, width] -> 2d 輸出 [miniBatchSize, channels, 1, 1]
5d (CNN3D)輸入帶有形狀 [miniBatchSize, channels, depth, height, width] -> 2d 輸出 [miniBatchSize, channels, 1, 1, 1]
引數 collapseDimensions 是否摺疊維度

pnorm

public Builder pnorm(int pnorm)

p-範數常數。僅為池化型別使用{- link PoolingType#PNORM}時使用。

引數 pnorm p-範數常數

LocalResponseNormalization（本地響應歸一化）

本地響應歸一化層
檢視3.3章節 http://www.cs.toronto.edu/~fritz/absps/imagenet.pdf

k

public Builder k(double k)

LRN度量常數 k. 預設為 : 2

引數 k 是度量常數

n

public Builder n(double n)

在執行LRN時使用的相鄰核心對映的數目。預設值：5

引數 n 相鄰核心對映的數目

alpha

public Builder alpha(double alpha)

LRN度量常數alpha。預設為: 1e-4

引數 alpha 度量常數

beta

public Builder beta(double beta)

度量常數beta。預設為: 0.75

引數 beta 度量常數

LocallyConnected1D （一維本地連線）

一維本地連線的SameDiff版本

nIn

public Builder nIn(int nIn)

引數 nIn 輸入到層的數量（輸入大小）

nOut

public Builder nOut(int nOut)

引數 nOut 輸出數量（輸出大小）

activation

public Builder activation(Activation activation)

引數 activation 層啟用函式

kernelSize

public Builder kernelSize(int k)

引數 k 層的核大小

stride

public Builder stride(int s)

引數s 層步幅

padding

public Builder padding(int p)

引數 p 層填充。如果 {- link ConvolutionMode#Same} 被設定，則不使用。

convolutionMode

public Builder convolutionMode(ConvolutionMode cm)

引數 cm 層卷積模式詳見 {- link ConvolutionMode}

dilation

public Builder dilation(int d)

引數 d 層膨脹係數

hasBias

public Builder hasBias(boolean hasBias)

引數 hasBias 如果是 true (預設為false) 則層有偏置

setInputSize

public Builder setInputSize(int inputSize)

為一維本地連線層設定輸入濾波器大小

引數 inputSize輸入濾波器的高度
返回 Builder

LocallyConnected2D（二維本地連線）

二維本地連線的SameDiff版本

nIn

public Builder nIn(int nIn)

引數 nIn 輸入到層的數量（輸入大小）

nOut

public Builder nOut(int nOut)

引數 nOut 輸出數量（輸出大小）

activation

public Builder activation(Activation activation)

引數 activation 層啟用函式

kernelSize

public Builder kernelSize(int... k)

引數 k 層的核大小。必須是2個值（高度/寬度）

stride

public Builder stride(int... s)

引數 s 層步幅，必須是2個值（高度/寬度）

padding

public Builder padding(int... p)

引數 p 層填充。如果{- link ConvolutionMode#Same}被設定，則不使用。必須是2個值（高度/寬度）

convolutionMode

public Builder convolutionMode(ConvolutionMode cm)

引數 cm 層卷積模式詳見 {- link ConvolutionMode}

dilation

public Builder dilation(int... d)

引數 d 層膨脹係數。必須是2個值（高度/寬度）

hasBias

public Builder hasBias(boolean hasBias)

引數 hasBias 如果是 true (預設為false) 則層有偏置

setInputSize

public Builder setInputSize(int... inputSize)

為二維本地連線層設定輸入濾波器大小（h，w）

引數 inputSize 這個層的輸入濾波器的高度和寬度對
返回 Builder

LossLayer （損失層）

損失層是在沒有MLP邏輯的輸入上執行損失函式的靈活輸出層。但損失層沒有任何引數。因此，不支援設定nIn/nOut ，輸出大小與輸入啟用大小相同。

public Builder(LossFunctions.LossFunction lossFunction)

引數 lossFunction 層損失函式

OutputLayer （輸出層）

通過基於標籤和指定損失函式的反向傳播訓練的輸出層。可以被配置為分類和迴歸。注意輸出層具有引數-它包含一個內部完全連線的層（有效地包含一個密連層）。這允許輸出大小與層輸入大小不同。

build

public Builder(LossFunction lossFunction)

引數 lossFunction 層損失函式

Pooling1D （一維池化）

支援這些池化型別: MAX, AVG, SUM, PNORM, NONE

Pooling2D （二維池化）

支援這些池化型別: MAX, AVG, SUM, PNORM, NONE

Subsampling1DLayer （一維子取樣層）

一維（臨時的）子取樣層-也被稱為池層。

支援這些池化型別: MAX, AVG, SUM, PNORM

Upsampling1D （一維上向取樣）

一維向上取樣層
示例:

如果輸入（對於單個示例，具有向下頁通道，以及從左到右的順序）是：
[ A1, A2, A3]
[ B1, B2, B3]
然後以size＝2的輸出為：
[ A1, A1, A2, A2, A3, A3]
[ B1, B1, B2, B2, B3, B2]

size

public Builder size(int size)

向上取樣大小

引數 size 一維層中的單一空間維度裡向上取樣大小

size

public Builder size(int[] size)

使用單個元素進行上取樣大小的 int陣列。陣列長度必須為1

引數 size 一維層中的單一空間維度裡向上取樣大小

Upsampling2D （二維向上取樣）

二維向上取樣層

按size[0]和size[1]次分別在高度和寬度維度重複每個值（或更確切地說，深度值集）。

示例：

輸入（一個示例和通道片段）
[ A, B ]
[ C, D ]
Size = [2, 2]
輸出（一個示例和通道片段）
[ A, A, B, B ]
[ A, A, B, B ]
[ C, C, D, D ]
[ C, C, D, D ]

size

public Builder size(int size)

向上取樣大小整數，用於高和寬。

引數 size 高度和寬度維度中的向上取樣大小

size

public Builder size(int[] size)

向上取樣大小陣列

引數 size 高度和寬度維度中的向上取樣大小

Upsampling3D （三維向上取樣）

三維向上取樣層
通過size[0], size[1] 和 size[2]重複每個值（每個 x/y/z位置的所有通道值）

size

public Builder size(int size)

向上取樣大小為整數，因此相同的向上取樣大小用於深度、寬度和高度。

引數 size 深度、寬度和高度維度中的向上取樣大小

size

public Builder size(int[] size)

向上取樣大小為整數陣列，因此相同的向上取樣大小用於深度、寬度和高度。

引數 size 深度、寬度和高度維度中的向上取樣大小

ZeroPadding1DLayer （一維零填充層）

卷積神經網路的一維零填充層。允許頂部和底部做單獨的填充。

build

public ZeroPadding1DLayer build()

引數 padding 對左右進行填充

ZeroPadding3DLayer（三維零填充層）

Zero padding 3D layer for convolutional neural networks. Allows padding to be done separately for “left” and “right” in all three spatial dimensions.

卷積神經網路的三維零填充層。允許在所有三個空間維度分別進行“左”和“右”填充。

build

public ZeroPadding3DLayer build()

引數 padding 在所有三個空間維度中的左、右填充

ZeroPaddingLayer （零填充層）

卷積神經網路（2D CNNs）的零填充層。允許對頂部/底部/左側/右側分別進行填充。

build

public ZeroPaddingLayer build()

引數 padHeight 底部和頂部填充
引數 padWidth 左右填充

ElementWiseMultiplicationLayer （元素乘法層）

w是nOut長度的一個可學習的權重向量
”.”是元素乘法
b 是一個偏置向量

注意，元素層的輸入和輸出大小對於該層是相同的。

getMemoryReport

public LayerMemoryReport getMemoryReport(InputType inputType)

這是一個給定層估計的記憶體消耗報告。

引數 inputType 層的輸入型別。記憶體消耗通常是輸入型別的函式。
返回層記憶體報告

RepeatVector （重複向量）

重複向量層配置

重複向量取一小批形狀(mb, length)和重複因子n，輸出形狀是一個三維張量(mb, n, length)，其中x被重複n次。

repetitionFactor

public Builder repetitionFactor(int n)

為重複向量層設定重複因子

引數 n 高度和寬度維度中的向上取樣大小

Yolo2OutputLayer

用於YOLOv2 目標檢測模型的輸出 (損失) 層, 基於論文: YOLO9000: Better, Faster, Stronger - Redmon & Farhadi (2016) - https://arxiv.org/abs/1612.08242
和
你只看一次: 統一實時目標檢測 - Redmon et al. (2016) - http://www.cv-foundation.org/openaccess/content_cvpr_2016/papers/Redmon_You_Only_Look_CVPR_2016_paper.pdf
這種損失函式的實現是基於YOLOv2版本的論文。但是，請注意，它目前不支援在YOlO9000文章中描述的檢測和分類資料集上同時進行訓練。

注意:Yolo2OutputLayer 應該有此形狀: [minibatch, b(5+c), H, W], 其中:
b = 邊界框的數量（由配置決定-見詳細的論文）
c = 分類數量
H = 輸出/標籤高度
W = 輸出/標籤寬度

重要：在實踐中，這意味著在Yolo2OutputLayer之前的最後一個卷積層應該具有b(5+c)深度的輸出。因此，如果更改邊界框的數量，或者更改目標分類的數量，則通道的數量（最後一個卷積層的nOut）也需要更改。
標籤格式: [minibatch, 4+C, H, W]
標籤深度順序: [x1,y1,x2,y2,(分類標籤)]
x1 = 左上角位置
y1 = 如上, y 軸
x2 = 邊框右下角位置
y2 =如上y 軸

注意：標籤被表示為網格大小的倍數-對於13x13網格，（0，0）是左上角，（13，13）是右下角。

還要注意，掩碼陣列不是必須的——這個實現從類標籤（如果存在物件，則應該是1-hot，否則應該是0）推斷每個網格單元中是否存在物件。

lambdaCoord

public Builder lambdaCoord(double lambdaCoord)

用於位置和大小/比例的損失函式係數由損失函式組成。預設為5

引數 lambdaCoord 由損失函式組成的用於大小/比例的Lambda值

lambbaNoObj

public Builder lambbaNoObj(double lambdaNoObj)

由損失函式組成的用於“無目標自信度”的損失函式係數。預設為0.5

引數 lambdaNoObj 由損失函式組成的用於“無目標自信度”的Lambda值

lossPositionScale

public Builder lossPositionScale(ILossFunction lossPositionScale)

由損失函式組成的用於位置/比例的損失函式

引數 lossPositionScale 用於位置/比例的損失函式

lossClassPredictions

public Builder lossClassPredictions(ILossFunction lossClassPredictions)

分類預測的損失函式-預設為L2損失（即，平方誤差之和，根據論文），但是也可以使用損失MCXENT。（這對於分類更為常見）。

引數 lossClassPredictions 由YOLO損失函式組成的用於分類預測錯誤的損失函式

boundingBoxPriors

public Builder boundingBoxPriors(INDArray boundingBoxes)

邊界框先驗維數[寬度，高度]。對於n個邊界框，輸入具有形狀 [rows, columns] = [N, 2] 注意，維度應指定為網格大小的分數。例如，具有13x13輸出的網路，值1.0將對應於一個網格單元；值13將對應於整個影象。

引數 boundingBoxes 邊界框先驗維數 (width, height)

MaskLayer （掩碼層）

掩碼層將掩碼陣列應用於正向傳播啟用，以及通過該層的反向傳播梯度。它可以與2D（前饋）、3D（時間序列）或4D（CNN）啟用一起使用。

MaskZeroLayer （零掩碼層）

等於指定掩碼值（0預設）的啟用與掩碼時間步的包裝器。假設輸入形狀為 [batch_size, input_size, timesteps]。

DL4J中文文件/模型/層

什麼是層? 神經網路配置中的每一層表示隱藏單元的單元。當層堆疊在一起時，它們代表了一個深度神經網路。使用層在Eclipse DL4J中可用的所有層都可以用在多層網路或計算圖中。當配置一個神經網路時，你傳遞層配置，網路會為你例項化該層。層VS頂點如果你正在配置諸如Incep

DL4J中文文件/模型/多層網路

為什麼用多層網路? MultiLayerNetwork類是Eclipse DL4J中可用的最簡單的網路配置API。該類對於不需要複雜和分支的網路圖的初學者或使用者很有用。如果你正在建立複雜的損失函式、使用圖頂點或執行類似如三重網路的高階訓練，則不希望使用MultiLayerNetwork配

DL4J中文文件/模型/自定義層

編寫自定義層有兩個元件可新增自定義層: 新增層配置類: 擴充套件 org.deeplearning4j.nn.conf.layers.Layer 新增層實現類: 實現 org.deeplearning4j.nn.api.Layer 配置層（以上（1）

DL4J中文文件/模型/卷積

什麼是卷積神經網路? 神經網路配置中的每一層表示隱藏單元的單元。當層堆疊在一起時，它們代表了一個深度神經網路。可用的層 Convolution1D （一維卷積） [原始碼] 一維卷積層。形狀期望的輸入啟用[小批量，通道，序列長度] Convolution2D（二維卷

DL4J中文文件/模型/計算圖

用計算圖構建複雜網路架構本頁描述瞭如何使用 DL4J的計算圖功能來構建更復雜的網路。內容計算圖概述計算圖：一些用例配置一個計算圖網路圖頂點型別示例1：具有跳過連線的迴圈網路示例2：多個輸入和合並頂點

DL4J中文文件/模型/自編碼器

什麼是自編碼器? 自編碼器是用於無監督學習的神經網路。Eclipse DL4J支援某些自動編碼器層，如變分自編碼器。受限波爾滋曼機在哪? 0.9.x版本已不再支援受限波爾滋曼機了，對於多數機器學習問題它們不再是最好的選擇了。支援的層 AutoEncoder（自編碼器）

DL4J中文文件/模型/監聽器

什麼是監聽器? 監聽器允許使用者在Eclipse DL4J中“掛鉤”到某些事件中。這允許你收集或列印對訓練等任務有用的資訊。例如，一個ScoreIterationListener允許你從神經網路的輸出層列印訓練分數。用法要將一個或多個監聽器新增到一個多層網路或計算圖中，請使用addL

DL4J中文文件/模型/頂點

頂點是什麼? 在Eclipse DL4J中，頂點是在計算圖中充當節點的一種層。它可以接受多個輸入，提供多個輸出，並且可以幫助構建流行的網路，如InceptionV4。可用的類 L2NormalizeVertex [原始碼] L2NormalizeVertex 在單個輸入上執

DL4J中文文件/模型/模型動物園

可用模型 AlexNet [原始碼] AlexNet Dl4J的AlexNet模型解釋基於原始論文《基於深度卷積神經網路的ImageNet分類》和引用的imagenet示例程式碼。參考文獻： http://papers.nips.cc/paper/4824-imagen

DL4J中文文件/模型/迭代器

什麼是迭代器? 資料集迭代器允許將資料輕鬆載入到神經網路中，並幫助組織批處理、轉換和掩碼。包含在Eclipse DL4J中的迭代器有助於使用者提供的資料，或者自動載入公共的基準資料集如MNIST和IRIS。用法對於大多數用例，初始化迭代器和傳遞一個引用到MultiLayerNetwo

DL4J中文文件/模型/RNN（迴圈神經網路）

DL4J中的迴圈神經網路本文概述了在DL4J中如何使用迴圈神經網路的具體訓練特徵和實用性。本文假定對迴圈神經網路及其使用有一定了解，而不是對遞迴神經網路的介紹，並且假定你對它們的使用和術語有一些熟悉。內容基礎：資料和網路配置 RNN訓練特徵通過時間截

DL4J中文文件/模型/模型持久化

神經網路的儲存與載入 ModelSerializer（模型序列化器）是一個處理載入和儲存模型的類。通過連結顯示的示例中儲存模型有兩種方法。第一個例子儲存了一個正常的多層網路，第二個例子儲存了一個計算圖。下面是一個基本示例，其中包含使用ModelSerializer類儲存計算圖的程式碼，以及

DL4J中文文件/模型/動物園用法

關於DL4J模型動物園 DL4J具有可直接從DL4J訪問和例項化的本地模型動物園。模型動物園還包括用於不同資料集的預訓練權重，這些資料集是自動下載的，並使用校驗總和機制檢查完整性。如果你想使用新的模型動物園，你需要新增它作為依賴項。Maven POM將新增以下內容： <depen

DL4J中文文件/模型/動物園模型

可用模型 AlexNet [原始碼] AlexNet Dl4J的AlexNet模型解釋基於原始論文《基於深度卷積神經網路的ImageNet分類》和引用的imagenet示例程式碼。參考文獻：在DL4J中建立基於可用功能的模型，註釋指示哪裡是等待增強的間隙。

DL4J中文文件/語言處理/Doc2Vec

在DL4J中的Doc2Vec, 或段落向量 Doc2Vec的主要目的是將任意文件與標籤關聯，因此需要標籤。Doc2Vec是Word2Vec的一個擴充套件，它學習關聯標籤和單詞，而不是用單詞關聯單詞。DL4J實現它的意圖是為了服務於Java、Scala和Culjule社群。第一步是提出一個表

DL4J中文文件/語言處理/Word2Vec

Word2Vec, Doc2vec & GloVe: 用於自然語言處理的神經詞嵌入內容介紹神經詞嵌入有趣的Word2Vec結果給我程式碼 Word2Vec 剖析安裝，載入與訓練程式碼示例問題排查

DL4J中文文件/語言處理/概述

DL4J的自然語言處理功能儘管沒有設計成可以與諸如Stanford CoreNLP或NLTK之類的工具相提並論，但DL4J確實包括本文描述的一些核心文字處理工具。 DL4J的NLP依賴 ClearTK，一個開源的機器學習和Apache非結構化資訊管理架構的自然語言處理框架，或UI

DL4J中文文件/語言處理/Vocabulary Cache

詞彙快取的工作原理詞彙快取是DL4J中處理通用自然語言任務的機制，包括普通TF-IDF、單詞向量和某些資訊檢索技術。詞彙快取的目標是成為文字向量化的一站式商店，其中封裝了單詞袋和單詞向量等常用的技術。詞彙快取通過倒排索引處理詞、詞統計頻率、倒排文件頻率和文件出現的儲存。InMemoryL

DL4J中文文件/語言處理/Tokenization

什麼是分詞? 分詞是將文字分解成單個單詞的過程。單詞視窗也是由片語成。 Word2Vec還可以輸出文字視窗，這些文字視窗包括用於輸入神經網路中的訓練示例，如本文所見。示例下面是一個用DL4J工具進行分詞的例子： //帶有詞形還原，詞性標註，句子分割的分詞

DL4J中文文件/語言處理/SentenceIterator

句子迭代器 SentenceIterator （句子迭代器）用於 Word2vec 和詞袋。它將一些文字以向量的形式輸入到神經網路中，也涵蓋了文字處理中的文件概念。在自然語言處理中，文件或句子通常用來封裝演算法應該學習的上下文。