日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 科技  > 軟件

直接把任意網站變為 API 接口?Firecrawl有點牛了!

來源: 責編: 時間:2024-07-19 07:56:08 247觀看
導讀Hello,大家好,我是 Sunday。最近看到了一個爬蟲類框架:firecrawl 號稱 可以抓取任何網站并將其轉換為干凈的 markdown 或結構化數據。并且可以直接通過 Node 進行部署。看這樣的描述有點厲害了,所以,咱們今天就來看看這個

Hello,大家好,我是 Sunday。Ngs28資訊網——每日最新資訊28at.com

最近看到了一個爬蟲類框架:firecrawl 號稱 可以抓取任何網站并將其轉換為干凈的 markdown 或結構化數據。并且可以直接通過 Node 進行部署。Ngs28資訊網——每日最新資訊28at.com

看這樣的描述有點厲害了,所以,咱們今天就來看看這個 firecrawlNgs28資訊網——每日最新資訊28at.com

01:什么是 firecrawl

firecrawl 是一種 API 服務,它獲取 URL、對其進行抓取并將其轉換為干凈的 markdown 或結構化數據。我們會抓取所有可訪問的子頁面并為您提供每個子頁面的干凈數據。無需站點地圖。Ngs28資訊網——每日最新資訊28at.com

目前 Firecrawl 開源 3周 的時間,已經有了 7.9K 的 star 數,可以說是一個優秀的項目了Ngs28資訊網——每日最新資訊28at.com

圖片圖片Ngs28資訊網——每日最新資訊28at.com

獲取秘鑰在這里注冊并獲取:https://www.firecrawl.dev/pricingNgs28資訊網——每日最新資訊28at.com

有了秘鑰之后,可以直接基于 Node 包創建項目即可:Ngs28資訊網——每日最新資訊28at.com

  1. 安裝依賴包 npm install @mendable/firecrawl-js
  2. 將 API 密鑰設置為命名的環境變量FIRECRAWL_API_KEY或將其作為參數傳遞給FirecrawlApp類
  3. 如要抓取單個 URL ,可直接通過 scrapeUrl 方法
try {  const url = "https://example.com";  const scrapedData = await app.scrapeUrl(url);  console.log(scrapedData);} catch (error) {  console.error("Error occurred while scraping:", error.message);}
  1. 如要爬取網站信息,可以直接通過 crawlUrl 方法。該方法以起始 URL 和可選參數作為參數。該params參數允許您為抓取作業指定其他選項,例如要抓取的最大頁面數、允許的域和輸出格式。
const crawlUrl = "https://example.com";const params = {  crawlerOptions: {    excludes: ["blog/"],    includes: [], // leave empty for all pages    limit: 1000,  },  pageOptions: {    onlyMainContent: true,  },};const waitUntilDone = true;const timeout = 5;const crawlResult = await app.crawlUrl(  crawlUrl,  params,  waitUntilDone,  timeout);
  1. 可以通過 checkCrawlStatus 方法檢查爬取狀態
const status = await app.checkCrawlStatus(jobId);console.log(status);
  1. 使用 LLM 可自動格式化所有數據
import FirecrawlApp from "@mendable/firecrawl-js";import { z } from "zod";const app = new FirecrawlApp({  apiKey: "fc-YOUR_API_KEY",});// Define schema to extract contents intoconst schema = z.object({  top: z    .array(      z.object({        title: z.string(),        points: z.number(),        by: z.string(),        commentsURL: z.string(),      })    )    .length(5)    .describe("Top 5 stories on Hacker News"),});const scrapeResult = await app.scrapeUrl("https://news.ycombinator.com", {  extractorOptions: { extractionSchema: schema },});console.log(scrapeResult.data["llm_extraction"]);
  1. 使用該 search 方法,您可以在搜索引擎中搜索查詢并獲取排名靠前的結果以及每個結果的頁面內容。該方法將查詢作為參數并返回搜索結果。
const query = "what is mendable?";const searchResults = await app.search(query, {  pageOptions: {    fetchPageContent: true, // 獲取每個搜索結果的頁面內容  },});


Ngs28資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-26-101703-0.html直接把任意網站變為 API 接口?Firecrawl有點牛了!

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 為什么StampedLock會導致CPU100%?

下一篇: 深入理解 JavaScript 中的 With 語句

標簽:
  • 熱門焦點
  • 鴻蒙OS 4.0公測機型公布:甚至連nova6都支持

    華為全新的HarmonyOS 4.0操作系統將于今天下午正式登場,官方在發布會之前也已經正式給出了可升級的機型產品,這意味著這些機型會率先支持升級享用。這次的HarmonyOS 4.0支持
  • 得物效率前端微應用推進過程與思考

    一、背景效率工程隨著業務的發展,組織規模的擴大,越來越多的企業開始意識到協作效率對于企業團隊的重要性,甚至是決定其在某個行業競爭中突圍的關鍵,是企業長久生存的根本。得物
  • 三言兩語說透柯里化和反柯里化

    JavaScript中的柯里化(Currying)和反柯里化(Uncurrying)是兩種很有用的技術,可以幫助我們寫出更加優雅、泛用的函數。本文將首先介紹柯里化和反柯里化的概念、實現原理和應用
  • 電視息屏休眠仍有網絡上傳 愛奇藝被質疑“薅消費者羊毛”

    記者丨寧曉敏 見習生丨汗青出品丨鰲頭財經(theSankei) 前不久,愛奇藝發布了一份亮眼的一季報,不僅營收和會員營收創造歷史最佳表現,其運營利潤也連續6個月實現增長。自去年年初
  • 10天營收超1億美元,《星鐵》比《原神》差在哪?

    來源:伯虎財經作者:陳平安即便你沒玩過《原神》,你一定聽說過的它的大名。恨它的人把《原神》開服那天稱作是中國游戲史上最黑暗的一天,有粉絲因為索尼在PS平臺上線《原神》,怒而
  • “又被陳思誠騙了”

    作者|張思齊 出品|眾面(ID:ZhongMian_ZM)如今的國產懸疑電影,成了陳思誠的天下。最近大爆電影《消失的她》票房突破30億斷層奪魁暑期檔,陳思誠再度風頭無兩。你可以說陳思誠的
  • 小米公益基金會捐贈2500萬元馳援北京、河北暴雨救災

    8月2日消息,今日小米科技創始人雷軍在其微博上發布消息稱,小米公益基金會宣布捐贈2500萬元馳援北京、河北暴雨救災。攜手抗災,京冀安康!以下為公告原文
  • iQOO 11S評測:行業唯一的200W標準版旗艦

    【Techweb評測】去年底,iQOO推出了“電競旗艦”iQOO 11系列,作為一款性能強機,該機不僅全球首發2K 144Hz E6全感屏,搭載了第二代驍龍8平臺及144Hz電競
  • Android 14發布:首批適配機型公布

    5月11日消息,谷歌在今天凌晨舉行了I/O大會,本次發布會谷歌帶來了自家的AI語言模型PaLM 2、谷歌Pixel Fold折疊屏、谷歌Pixel 7a手機,同時發布了Androi
Top 主站蜘蛛池模板: 盐亭县| 大港区| 年辖:市辖区| 连云港市| 罗城| 长武县| 丁青县| 张家界市| 上饶县| 图片| 桐柏县| 香河县| 荣昌县| 浑源县| 磐安县| 松滋市| 久治县| 汾阳市| 固安县| 文山县| 乌什县| 离岛区| 磴口县| 华坪县| 澜沧| 昌宁县| 重庆市| 枣阳市| 镇江市| 商河县| 隆子县| 江永县| 阳信县| 东城区| 陇川县| 洞头县| 山东| 藁城市| 理塘县| 会昌县| 白沙|