您好:
目標
start_urls = ["https://code.tutsplus.com/t/tutorials"]
以下HTML 是 用CHROM F12COPY出來的element
其中 目前是可以用,以下程式碼抓出
v_author=tut.css("footer > div >div> a::text").extract_first().strip() #OK
但我想試著了解用
#v_author=tut.css("a[aria-label^='Author:']::text").extract_first().strip()
或
#v_author=tut.css("footer > div >div> a.flex z-[1] relative rounded-md::text").extract_first().strip()
但這都抓不到值
請問類似這種情況
1.我要抓 或其他標籤內 屬性aria-label="Author:" 開頭的,要如何下?
2.class 內 flex z-[1] relative text-grey-700 block,這應該是多個class
要若要以這一串為搜索標準,要如何下?
謝謝
<div class="flex mt-4 [&>div>a]:!inline-block [&>div>a]:truncate [&>div>a]:max-w-[160px]" xpath="1">
<a class="flex z-[1] relative rounded-md" aria-label="Author: Jemima Abu"
href="https://tutsplus.com/authors/jemima-abu">
<img src="https://cms-assets.tutsplus.com/uploads/users/2722/profiles/21247/profileImage/jemima_3.jpeg"
class="rounded-md" alt="Jemima Abu" width="32px" height="32px" loading="lazy">
</a>
<div class="text-xs md:text-sm flex ml-2 w-max leading-5 items-center">
<a class="flex z-[1] relative text-grey-700 block" aria-label="Author: Jemima Abu"
href="https://tutsplus.com/authors/jemima-abu">
Jemima Abu
</a>
<span class="text-grey-500 ml-1 mr-1">•</span>
<time class="text-grey-500">14 Oct 2024</time>
</div>
</div>