มาดูกันว่าฉันสามารถอธิบายปัญหาของฉันโดยย่อได้หรือไม่
ลองนึกภาพเรามีตาราง HBase ที่มีข้อมูลของการเยี่ยมชมดิสโก้ทุกครั้ง: ดิสโก้ทุกแห่งจะลงทะเบียน ชื่อ, ชื่อของผู้เยี่ยมชม และ วัน< /em> เขาไปเยี่ยมมัน (ใช่ มันเป็นตัวอย่างโง่ๆ ฉันรู้..)
ตัวอย่างเช่น ค่าเหล่านี้จะเป็นค่าบางค่าของตาราง:
..
ministryOfSoundJamesOliver01022017
ministryOfSoundJamesOliver02022017
ministryOfSoundJamesOliver03022017
ministryOfSoundOliviaNewton04042017
ministryOfSoundOliviaNewton06042017
...
pachaibizaJohnMcKiness06042017
pachaibizaJohnMcKiness04042017
pachaibizaWilliamForrester04042017
..
RowKey มีโครงสร้างดังต่อไปนี้:
ดิสโก้ชื่อ
ชื่อบุคคล
วันแห่งปี
(ตารางมีคอลัมน์/ตัวระบุอื่นๆ แต่ฉันไม่สนใจเกี่ยวกับปัญหานี้)
ปัญหาคือ ลองจินตนาการถึงเด็กผู้ชายคนหนึ่งที่ชอบไปกระทรวงเสียง เขาแค่ชอบมัน เขาใช้เงินทั้งหมดไปกับดิสโก้และยาเสพติด (แต่นั่นไม่ใช่ประเด็นที่นี่)
เป้าหมายของฉันคือ แสดงทุกคนที่เข้าร่วม Ministry Of Sound ในการสแกนของฉัน เพื่อนคนนี้ยังคงปรากฏในผลลัพธ์ ดังนั้นฉันต้องทิ้งรายการจำนวนมากเพื่อค้นหาผู้เยี่ยมชมรายต่อไป เฟ:
..
ministryOfSoundJohnnyYonkie01022017
ministryOfSoundJohnnyYonkie02022017
ministryOfSoundJohnnyYonkie03022017
ministryOfSoundJohnnyYonkie04022017
ministryOfSoundJohnnyYonkie05022017
ministryOfSoundAnotherDude02022017
...
หากต้องการลงทะเบียน AnotherDude ฉันต้องละทิ้ง 4 รายการจาก Johnny
สุดท้ายนี้คำถามคือ:
มีวิธีใดที่จะบอก HBase ว่ารายการซ้ำจาก byte(x) ถึง byte(x+y) [ x เป็นจำนวนไบต์จาก discoName
และ y จำนวนไบต์จาก personName
] จะต้องเป็น < strong>ทิ้งโดยอัตโนมัติ?
ขอบคุณมากในล่วงหน้า!!