iT邦幫忙

0

python scrapy css抓值

  • 分享至 

  • xImage

您好:
目標
start_urls = ["https://code.tutsplus.com/t/tutorials"]

以下HTML 是 用CHROM F12COPY出來的element
其中 目前是可以用,以下程式碼抓出

v_author=tut.css("footer > div >div> a::text").extract_first().strip() #OK

但我想試著了解用

#v_author=tut.css("a[aria-label^='Author:']::text").extract_first().strip()
或
#v_author=tut.css("footer > div >div> a.flex z-[1] relative rounded-md::text").extract_first().strip()

但這都抓不到值
請問類似這種情況
1.我要抓 或其他標籤內 屬性aria-label="Author:" 開頭的,要如何下?
2.class 內 flex z-[1] relative text-grey-700 block,這應該是多個class
要若要以這一串為搜索標準,要如何下?
謝謝

    <div class="flex mt-4 [&amp;>div>a]:!inline-block [&amp;>div>a]:truncate [&amp;>div>a]:max-w-[160px]" xpath="1">
        <a class="flex z-[1] relative rounded-md" aria-label="Author: Jemima Abu"
            href="https://tutsplus.com/authors/jemima-abu">


            <img src="https://cms-assets.tutsplus.com/uploads/users/2722/profiles/21247/profileImage/jemima_3.jpeg"
                class="rounded-md" alt="Jemima Abu" width="32px" height="32px" loading="lazy">


        </a>
        <div class="text-xs md:text-sm flex ml-2 w-max leading-5 items-center">
            <a class="flex z-[1] relative text-grey-700 block" aria-label="Author: Jemima Abu"
                href="https://tutsplus.com/authors/jemima-abu">


                Jemima Abu


            </a>
            <span class="text-grey-500 ml-1 mr-1">•</span>
            <time class="text-grey-500">14 Oct 2024</time>
        </div>


    </div>
froce iT邦大師 1 級 ‧ 2024-12-01 16:31:29 檢舉
1. 看到的都說轉XPATH解決
2. .flex.z-[1].relative.rounded-md,連在一起就好
noway iT邦研究生 1 級 ‧ 2024-12-01 20:34:21 檢舉
您好:
1.您是說都用XPATH 來做嗎?

2. v_author=tut.css("footer > div >div> a.flex.z-[1].relative.rounded-md::text").extract_first().strip()
這樣抓不到資料

謝謝
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友回答

立即登入回答