ขณะนี้ฉันกำลังมองหาวิธีดำเนินการจับคู่รูปแบบผ่าน regex ที่จุดเริ่มต้นของชื่อคลาส HTML รูปแบบที่ฉันพยายามจับคู่คือ:
"col-xs-.*"
สองตัวอย่างของคลาสในหน้า HTML คือ:
<div class="col-xs-12 col-sm-12 col-lg-12">
<div class="mod-tiles__sizer col-xs-6 col-sm-4 col-lg-3">
เป้าหมายคือจับคู่ชื่อคลาสข้างต้นเท่านั้น เนื่องจากจริงๆ แล้วมันขึ้นต้นด้วย "col-xs-.*" ซึ่งเป็นสิ่งที่ฉันตามหา การใช้การจับคู่ regex ปัจจุบันของฉันฉันไม่สามารถแยกชื่อคลาสเหล่านี้ออกมาได้ ขณะนี้ฉันกำลังพยายามจับคู่โดยใช้รูปแบบ regex ต่อไปนี้:
regex = re.compile('^col-xs-.*$')
soup.find_all("div", class_ = regex)
น่าเสียดายที่รูปแบบนี้ยังพิมพ์ชื่อคลาสที่สองออกมาด้วย (โดยที่ "col-xs-.*" ปรากฏตรงกลางและไม่ใช่แค่ตอนเริ่มต้น) หวังว่าบางคนจะมีวิธีแก้ไขปัญหานี้
.*
จะตรงกันจนถึงจุดสิ้นสุดของสตริง ลอง\bcol-xs-\d+\b
- person The fourth bird   schedule 20.07.2019