Miért gyors a presto?

Pontszám: 4,7/5 ( 21 szavazat )

A Presto a „push” modellt követi, amely egy SQL-lekérdezést dolgoz fel több, párhuzamosan futó szakaszon keresztül. Az upstream szakasz az alsó szakaszaitól kap adatokat, így a közbenső adatok közvetlenül továbbíthatók , így a lekérdezés lényegesen gyorsabb.

Miért gyorsabb a Presto, mint a Spark?

A Presto-lekérdezések általában gyorsabban futhatnak, mint a Spark-lekérdezések , mivel a Presto-nak nincs beépített hibatűrése . A Spark támogatja a hibatűrést, és vissza tudja állítani az adatokat, ha a folyamat során hiba lép fel, de a hiba aktív tervezése többletterhelést jelent, amely hatással van a Spark lekérdezési teljesítményére.

A Presto gyorsabb, mint a Spark?

A Presto minden lekérdezésnél következetesen gyorsabb, mint a Hive és a SparkSQL . A Presto jobban skálázható, mint a Hive és a Spark az egyidejű lekérdezésekhez. Kisebb lekérdezések esetén a Hive folyamatosan jobban teljesít, mint a SparkSQL. A csatlakozások számának növelése általában megnöveli a lekérdezés feldolgozási idejét.

Mennyivel gyorsabb a Presto?

Allegro – gyors, gyors és fényes (109–132 BPM) Vivace – élénk és gyors (132–140 BPM) Presto – rendkívül gyors (168–177 BPM) Prestissimo – még gyorsabb, mint a Presto (178 BPM és több)

Miért jobb a Presto, mint a Hive?

A Presto-t úgy tervezték, hogy megfeleljen az ANSI SQL-nek, míg a Hive HiveQL-t használ. A Presto korlátozott mennyiségű adatot tud kezelni, ezért jobb a Hive használata nagy jelentések generálásakor . ... A Hive térképcsökkentési architektúrát használ, és adatokat ír lemezre, míg a Presto HDFS architektúrát használ térképcsökkentés nélkül.

The Music Show 5. epizód: Presto gyors, Largo lassú

40 kapcsolódó kérdés található

Presto a memóriában van?

A Presto a memóriában van? A Presto által használt memória általában magának a JVM-nek a környezetében található , a lekérdezések méretétől és a feladatok összetettségétől függően több vagy kevesebb memóriát is lefoglalhat a JVM-eknek. Maga a Presto azonban nem használja ezt a memóriát adatok gyorsítótárazására.

Működhet a Presto Hive nélkül?

4 válasz. Van egy kerülő megoldás, hogy nincs szükség hive-re a presto futtatásához .

A Presto le tudja kérdezni az S3-at?

Emiatt a Presto számos csatlakozóval rendelkezik, beleértve a nem relációs forrásokat, például a Hadoop Distributed File System (HDFS), az Amazon S3, a Cassandra, a MongoDB és a HBase, valamint a relációs forrásokat, mint például a MySQL, PostgreSQL, Amazon Redshift, Microsoft. SQL Server és Teradata.

Presto Postgres?

A Presto, a Facebook által nyílt forráskódú elosztott SQL motor, amelyet a Treasure Data a szolgáltatása részeként fogadott el. Postgres , az egyik legsokoldalúbb RDBMS.

A Presto a Hive-n alapul?

A Hive és a Presto használata A Presto nem tartalmazza a Hadoop fájlrendszer beépített támogatását, és más eszközöket is igénybe kell vennie, például a Hive-csatlakozót (más néven HCatalog). A presto egyik erőssége, hogy alkalmas csillagséma modellekhez.

A spark SQL gyorsabb, mint a Hive?

Sebesség: – A Hive műveletei lassabbak, mint az Apache Spark a memória és a lemezfeldolgozás tekintetében, mivel a Hive a Hadoop tetején fut. Olvasási/írási műveletek: – A Hive-ben az olvasási/írási műveletek száma nagyobb, mint az Apache Sparkban. Ennek az az oka, hogy a Spark közbenső műveleteit magában a memóriában végzi el.

Mi a különbség a Presto és az Athena között?

Az Athena esetében a költség lekérdezésenként 5 USD/TB szkennelt áron. Ha szervezete sok adattal rendelkezik, de csak néhány lekérdezés naponta, akkor az Athena egyértelműen a gazdaságos választás. ... De a Presto nagyon hatékony , és ha az adatok megfelelően vannak tárolva, néhány árugép nagyszerű munkát fog végezni.

Mi az a Spark Presto?

A Spark Core a Spark platform alapvető végrehajtó motorja. Beállít. A Presto egy elosztott SQL lekérdező motor, amely kisállat bájtnyi adat feldolgozására szolgál, és egy olyan fürtön fut, mint egy gépkészlettel. A teljes Presto-fürtbeállítás egy koordinátort (Manager Node) és több dolgozót tartalmaz.

A Presto NoSQL?

A Presto db lehetővé teszi az adatok lekérdezését ott, ahol élnek, beleértve a Hive-t, az AWS S3-at, a Hadoop-ot, a Cassandra-t, a relációs adatbázisokat, a NoSQL adatbázisokat vagy akár a védett adattárakat. A Presto adatbázis nyílt forráskódú motorja lehetővé teszi a felhasználók számára, hogy több forrásból is hozzáférjenek az adatokhoz, lehetővé téve az egész szervezet elemzését.

Az Athena a Presto-n alapul?

Az Amazon Athena a Presto-t teljes szabványos SQL-támogatással használja, és számos szabványos adatformátummal működik, beleértve a CSV-t, a JSON-t, az ORC-t, az Avro-t és a Parquet-t. Az Athena komplex elemzéseket tud kezelni, beleértve a nagy összekapcsolásokat, ablakfüggvényeket és tömböket.

Hogyan gyorsabb a Presto, mint a Hive?

A Hive a lekérdezési sebességre, míg a Presto a késleltetésre van optimalizálva. A Presto korlátozza azt a maximális memóriamennyiséget, amelyet a lekérdezés egyes feladatai tárolhatnak, így ha egy lekérdezés nagy mennyiségű memóriát igényel, a lekérdezés egyszerűen meghiúsul. ... Az ilyen feladatokhoz a Hive jobb alternatíva.

Hol használják a Presto-t?

A Presto-kártya (PRESTO-ként stilizált) egy érintés nélküli intelligens kártyás, automatizált viteldíjbeszedő rendszer, amelyet a kanadai Ontario tartományban , különösen Nagy Torontóban, Hamiltonban és Ottawában használnak a résztvevő tömegközlekedési rendszereken.

Mi az a Trino?

A Trino egy ANSI SQL-kompatibilis lekérdezőmotor , amely olyan BI-eszközökkel működik, mint az R, Tableau, Power BI, Superset és sok más.

Hogyan használja a Facebook a Presto-t?

A Facebook a Presto-t használja több belső adattárral, köztük a 300 PB-s adattárházzal kapcsolatos interaktív lekérdezésekhez . Több mint 1000 Facebook-alkalmazott használja naponta a Presto-t több mint 30 000 lekérdezés futtatására, amelyek összesen naponta egy-egy petabájtot vizsgálnak.

Hogyan kérdezz a Presto-ban?

Lépjen az Elemzés oldalra, és kattintson a Létrehozás gombra. Válassza a Presto Query lehetőséget a Parancstípus legördülő listából . A Query Statement alapértelmezés szerint ki van választva a legördülő listából.

A vöröseltolódás használja a Presto-t?

A Presto és a Redshift integrálása új lehetőségeket kínál a felhasználók számára: A Presto közvetlenül a HDFS-ből olvassa be az adatokat , így nem kell ETL-t végrehajtania az adatokon. A Presto-t úgy is kiterjesztették, hogy különböző típusú adatforrásokon működjön, beleértve a hagyományos relációs adatbázisokat és más adatforrásokat, például a Redshiftet.

Mi az a Presto API?

A Presto HTTP API (Presto Rest API) a szerver és az ügyfél közötti kommunikációs protokoll . Lekérdezési utasítások küldésére szolgál a kiszolgálón történő végrehajtáshoz, és az eredmények visszaküldésére az ügyfélnek. A Presto alapértelmezett portja a 8080 a nem biztonságos fürtökhöz. ...

A BigQuery a Presto-n alapul?

A Presto segítségével a szervezetek zökkenőmentesen futtathatnak egyesített lekérdezéseket olyan nagyméretű adattárak között, mint a BigQuery, a Hadoop Distributed File System, a Cloud Storage, a Cloud SQL for MySQL, az Apache Cassandra vagy az Apache Kafka. Íme néhány konkrét felhasználási eset.