ฉันกำลังสร้างโมเดล LSTM เพื่อจัดประเภทข้อมูลบทวิจารณ์บางส่วนโดยใช้ Keras เอาต์พุตเป็นเพียง 1 หรือ 0
ฉันเพิ่มเลเยอร์การฝังคำก่อนที่จะป้อนข้อมูลข้อความลงในเลเยอร์ lstm ส่วนหนึ่งของรหัสของฉันแสดงอยู่ด้านล่าง นี่คือ max_feature คือขนาดคำศัพท์ ขนาดเวกเตอร์ของ Word คือ 2 ขนาดของแต่ละเอกสารคือ maxlen เอกสารทั้งหมดได้รับการเสริมความยาวเท่ากันแล้ว
อย่างไรก็ตาม ฉันมักจะสับสนกับความยาวของเลเยอร์ LSTM เสมอ นั่นควรมีความยาวเท่ากับความยาวของเอกสารของฉัน (แม็กซ์เลน) หรือไม่ ป้อนทุกคำในแต่ละเอกสารและรับผลลัพธ์ใช่ไหม.....
มีแหล่งข้อมูลออนไลน์ไม่กี่แห่งที่อธิบาย LSTM แต่ในส่วนของการใช้งาน รู้สึกว่ามีไม่มากที่อธิบายได้ชัดเจน...
ขอขอบคุณจริงๆถ้ามีคนสามารถชี้แจงเกี่ยวกับเรื่องนี้
# max_features: vocabulary size
# word vector size: 2
# maxlen: my document size, already padded to the same length
# Build our model
print('Build model...')
model = Sequential()
model.add(Embedding(input_dim=max_features, output_dim= 2, input_length=maxlen ))
model.add(LSTM(units= ???? ))
model.add(Dense(1))
model.add(Activation('sigmoid'))
model.compile(loss='binary_crossentropy',
optimizer='adam',
metrics=['accuracy'])